Știința datelor - Ce este, definiție și concept

Cuprins:

Știința datelor - Ce este, definiție și concept
Știința datelor - Ce este, definiție și concept
Anonim

Știința datelor este o disciplină care studiază de unde provine o anumită bază de informații. De asemenea, se discută modul în care aceste resurse pot fi interpretate și reprezentate pentru o utilizare productivă.

Adică, știința datelor este cea legată de gestionarea bazelor de date, stocate în fișiere digitale, din care se pot extrage multe informații utile ca indicatori statistici. Acestea pot ajuta, de exemplu, o companie să ia decizii de afaceri.

La fel, știința datelor oferă instrumente care permit nu numai interpretarea, ci și reprezentarea, de exemplu, în imagini, a datelor disponibile. Astfel, avem histograma, diagrama de bare, diagrama circulară, printre altele.

După cum se poate deduce, această știință este interdisciplinară, deoarece acoperă în principal cunoștințele de matematică, statistici și informatică.

Știința datelor și tipurile de date

De asemenea, trebuie remarcat faptul că știința datelor poate funcționa cu două tipuri de date:

  • Structurat: Sunt cele organizate, cum ar fi acele tabele cu coloane diferite, fiecare cu o categorie diferită, cum ar fi: numele, prenumele, vârsta, numărul documentului de identitate etc.
  • Nestructurat: Cele care nu corespund unui anumit format, cum ar fi un text scris în mod liber. În acest caz, trebuie să interpretați conținutul și să extrageți datele care pot fi gestionate.

Ținând cont de toate cele explicate, profesioniștii specializați în știința datelor trebuie să aibă nu numai abilități analitice, ci trebuie să fie capabili să comunice conținutul informațiilor pe care le-au procesat.

Importanța științei datelor

Știința datelor este importantă pentru companiile sau instituțiile care trebuie să lucreze cu o cantitate mare de date. Astfel, acestea pot deveni informații valoroase.

Putem relaționa știința datelor cu Big Data, care constă în dezvoltarea de mecanisme capabile să proceseze și să gestioneze date masive care provin din diverse surse. Obiectivul este de a le converti în informații capabile să fie interpretate de ființa umană și care îl ajută să ia decizii.

Aceste date de procesat pot proveni din tranzacții între persoane și organizații (cum ar fi operațiuni bancare), acțiuni zilnice ale oamenilor (cum ar fi căutări pe Internet), mașini (cum ar fi GPS-ul telefonului mobil care înregistrează unde a fost utilizatorul) sau informații biometric (cum ar fi amprenta).

Istoria științei datelor

Se poate spune că statisticianul american John Wilder Tukey a fost pionierul științei datelor în anii 1960, subliniind importanța analizei datelor, mai degrabă decât testarea modelelor statistice.

Cu toate acestea, abia în 1996 termenul știința datelor a fost folosit pentru prima dată în titlul unei prelegeri, în discuția numită: „Știința datelor, clasificare și metode conexe”. Aceasta, în cadrul reuniunii membrilor „Federației Internaționale a Societăților de Clasificare” (IFCS) care a avut loc la Kobe, Japonia.

O altă etapă importantă a venit în 2005, când „Colecțiile de date digitale de lungă durată care permit cercetarea și educația în secolul 21” a fost publicat de The National Science Board. În acel document, oamenii de știință ai datelor sunt definiți ca experți în calculatoare, programatori de baze de date și software și profesioniști din alte discipline (cum ar fi bibliotecarii și arhiviștii), care sunt cruciale pentru gestionarea cu succes a unei colecții de date digitale.

Cu toate acestea, acesta este încă un domeniu de studiu încă în curs de dezvoltare.