Data Mining - Ce este, definiție și concept

Cuprins:

Data Mining - Ce este, definiție și concept
Data Mining - Ce este, definiție și concept
Anonim

Exploatarea datelor este procesul de căutare în baze de date mari pentru a găsi informații utile care pot fi utilizate pentru luarea deciziilor. Termenul englezesc „data mining” este, de asemenea, folosit.

Poate fi înțeles ca tehnologia și software-ul utilizat pentru a găsi modele de comportament în baza de date. Baza fundamentală pentru aceasta este că aceste tipare ajută la luarea deciziilor. De exemplu, ar putea ajuta companiile să înțeleagă tiparele de comportament ale clienților lor. În așa fel încât să faciliteze stabilirea unor strategii pentru creșterea vânzărilor sau reducerea costurilor.

Avantajele exploatării datelor

Avantajul fundamental al acestui proces de analiză a datelor este numărul mare de scenarii de afaceri cărora li se poate aplica, ca exemplu:

  • Predicție: Prognoza vânzărilor companiei.
  • Probabilitate: Selectarea celor mai buni clienți pentru contact direct fie prin telefon, fie prin e-mail.
  • Analiza secvenței: Analiza produselor cumpărate de clienți și verificarea relației dintre ele.

Etapele exploatării datelor

În cadrul unui proces de extragere a datelor putem găsi cinci etape:

  • Obiectiv și colectarea datelor: În primul rând este să ne concentrăm asupra tipului de informații pe care dorim să îl obținem. Să ne imaginăm exemplul conform căruia un supermarket vrea să știe ce oră din zi este cea mai mare prezență a clienților. Acesta ar fi obiectivul și informațiile pe care comerțul dorește să le obțină în acest caz.
  • Prelucrarea și gestionarea datelor: Odată ce cunoaștem datele pe care dorim să le colectăm, le punem la lucru. Aceasta este probabil cea mai dificilă fază a procesului. Ei bine, necesită selectarea eșantionului reprezentativ pe care urmează să fie efectuată analiza. Odată ce eșantionul a fost ales, trebuie analizat ce tip de variabile sau model de regresie urmează să fie efectuat pe eșantion.
  • Selectarea modelului: Este strâns legat de faza anterioară. Este vorba despre crearea unui model sau algoritm care să ne ofere cel mai bun rezultat posibil. Pentru a face acest lucru, trebuie efectuată o analiză exhaustivă a variabilelor care trebuie incluse în model. Aceasta devine o sarcină complicată, deoarece va depinde de tipul de informații care urmează să fie analizate. Prin urmare, minerii de date efectuează diferite teste ale algoritmului, cum ar fi: regresia liniară, arborele decizional, seria temporală, rețeaua neuronală etc.
  • Analiza și revizuirea rezultatelor: Practic, este să analizăm rezultatele pentru a vedea dacă dau o explicație logică. Explicație care facilitează luarea deciziilor pe baza informațiilor furnizate de rezultate.
  • Actualizare model: Ultimul pas al procesului ar fi actualizarea modelului. Este foarte important să se facă în timp pentru a nu deveni învechit. Variabilele modelului ar putea deveni nesemnificative și, prin urmare, este necesar un control periodic al modelului.