Data mining vs Data Warehousing
Data Mining e Data Warehousing sono entrambe tecniche molto potenti e popolari per l'analisi dei dati. Gli utenti inclini alle statistiche utilizzano il data mining. Utilizzano modelli statistici per cercare modelli nascosti nei dati. I minatori di dati sono interessati a trovare relazioni utili tra i diversi elementi di dati, che è in definitiva redditizio per le imprese. D'altro canto, gli esperti di dati che possono analizzare direttamente le dimensioni dell'azienda tendono a utilizzare i data warehouse.
Il data mining è anche noto come Knowledge Discovery in data (KDD). Come accennato in precedenza, si tratta di un settore dell'informatica, che si occupa dell'estrazione di informazioni precedentemente sconosciute e interessanti dai dati grezzi. A causa della crescita esponenziale dei dati, specialmente in aree come il business, il data mining è diventato uno strumento molto importante per convertire questa grande ricchezza di dati in business intelligence, in quanto l'estrazione manuale di modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come l'analisi dei social network, il rilevamento di frodi e il marketing. Il data mining di solito tratta i seguenti quattro compiti: clustering, classificazione, regressione e associazione. Il clustering identifica gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate ai nuovi dati e in genere include i seguenti passaggi: preelaborazione dei dati, progettazione di modelli, apprendimento / selezione delle caratteristiche e valutazione / convalida. La regressione sta trovando le funzioni con un errore minimo per modellare i dati. E l'associazione sta cercando relazioni tra variabili. Il data mining viene solitamente utilizzato per rispondere a domande quali quali sono i principali prodotti che potrebbero aiutare ad ottenere alti profitti l'anno prossimo in Wal-Mart?
Come accennato in precedenza, il data warehousing viene utilizzato anche per analizzare i dati, ma da diversi gruppi di utenti e un obiettivo leggermente diverso in mente. Ad esempio, quando si tratta del settore retail, gli utenti del data warehousing sono più interessati ai tipi di acquisti più popolari tra i clienti, quindi i risultati dell'analisi possono aiutare il cliente migliorando l'esperienza del cliente. Ma i minatori di dati in primo luogo congetturano un'ipotesi in base alla quale i clienti acquistano un determinato tipo di prodotto e analizzano i dati per verificare l'ipotesi. Il data warehousing potrebbe essere effettuato da un importante rivenditore che inizialmente scorta i suoi negozi con le stesse dimensioni di prodotti per poi scoprire che i negozi di New York vendono l'inventario di dimensioni più piccole molto più velocemente rispetto ai negozi di Chicago. Quindi, guardando questo risultato, il rivenditore può immagazzinare il negozio di New York con dimensioni più piccole rispetto ai negozi di Chicago.
Quindi, come puoi vedere chiaramente, questi due tipi di analisi sembrano essere della stessa natura ad occhio nudo. Entrambi preoccupano di aumentare i profitti sulla base dei dati storici. Ma ovviamente ci sono differenze fondamentali. In termini semplici, Data Mining e Data Warehousing sono dedicati all'arredamento di diversi tipi di analisi, ma sicuramente per diversi tipi di utenti. In altre parole, Data Mining cerca correlazioni, pattern per supportare un'ipotesi statistica. Ma, Data Warehousing risponde a una domanda relativamente più ampia e taglia e taglia dati da lì in poi per riconoscere i modi di migliorare in futuro.