Știința datelor - Ce este, definiție și concept

Știința datelor este o disciplină care studiază de unde provine o anumită bază de informații. De asemenea, se discută modul în care aceste resurse pot fi interpretate și reprezentate pentru o utilizare productivă.

Adică, știința datelor este cea legată de gestionarea bazelor de date, stocate în fișiere digitale, din care se pot extrage multe informații utile ca indicatori statistici. Acestea pot ajuta, de exemplu, o companie să ia decizii de afaceri.

La fel, știința datelor oferă instrumente care permit nu numai interpretarea, ci și reprezentarea, de exemplu, în imagini, a datelor disponibile. Astfel, avem histograma, diagrama de bare, diagrama circulară, printre altele.

După cum se poate deduce, această știință este interdisciplinară, deoarece acoperă în principal cunoștințele de matematică, statistici și informatică.

Știința datelor și tipurile de date

De asemenea, trebuie remarcat faptul că știința datelor poate funcționa cu două tipuri de date:

  • Structurat: Sunt cele organizate, cum ar fi acele tabele cu coloane diferite, fiecare cu o categorie diferită, cum ar fi: numele, prenumele, vârsta, numărul documentului de identitate etc.
  • Nestructurat: Cele care nu corespund unui anumit format, cum ar fi un text scris în mod liber. În acest caz, trebuie să interpretați conținutul și să extrageți datele care pot fi gestionate.

Ținând cont de toate cele explicate, profesioniștii specializați în știința datelor trebuie să aibă nu numai abilități analitice, ci trebuie să fie capabili să comunice conținutul informațiilor pe care le-au procesat.

Importanța științei datelor

Știința datelor este importantă pentru companiile sau instituțiile care trebuie să lucreze cu o cantitate mare de date. Astfel, acestea pot deveni informații valoroase.

Putem relaționa știința datelor cu Big Data, care constă în dezvoltarea de mecanisme capabile să proceseze și să gestioneze date masive care provin din diverse surse. Obiectivul este de a le converti în informații capabile să fie interpretate de ființa umană și care îl ajută să ia decizii.

Aceste date de procesat pot proveni din tranzacții între persoane și organizații (cum ar fi operațiuni bancare), acțiuni zilnice ale oamenilor (cum ar fi căutări pe Internet), mașini (cum ar fi GPS-ul telefonului mobil care înregistrează unde a fost utilizatorul) sau informații biometric (cum ar fi amprenta).

Istoria științei datelor

Se poate spune că statisticianul american John Wilder Tukey a fost pionierul științei datelor în anii 1960, subliniind importanța analizei datelor, mai degrabă decât testarea modelelor statistice.

Cu toate acestea, abia în 1996 termenul știința datelor a fost folosit pentru prima dată în titlul unei prelegeri, în discuția numită: „Știința datelor, clasificare și metode conexe”. Aceasta, în cadrul reuniunii membrilor „Federației Internaționale a Societăților de Clasificare” (IFCS) care a avut loc la Kobe, Japonia.

O altă etapă importantă a venit în 2005, când „Colecțiile de date digitale de lungă durată care permit cercetarea și educația în secolul 21” a fost publicat de The National Science Board. În acel document, oamenii de știință ai datelor sunt definiți ca experți în calculatoare, programatori de baze de date și software și profesioniști din alte discipline (cum ar fi bibliotecarii și arhiviștii), care sunt cruciale pentru gestionarea cu succes a unei colecții de date digitale.

Cu toate acestea, acesta este încă un domeniu de studiu încă în curs de dezvoltare.

Posturi Populare

ValueSchool și partener pentru a stimula educația financiară

Economipedia și Value School își unesc forțele pentru a promova educația financiară și pentru a facilita înțelegerea unor subiecte de bază precum economisirea, finanțarea și investițiile. Pe de o parte, ValueSchool este un proiect axat pe promovarea culturii financiare, a economiilor și a investițiilor în Spania. Născut din nevoia de a împărtăși Citiți mai multe…

Big data modelează lumea viitorului

S-au spus multe despre Big Data și impactul pe care acesta îl are asupra unor sectoare, nu numai economice și de afaceri, ci și asupra administrației publice sau a sănătății. Dar ce înseamnă Big Data? Big Data se referă la volumul enorm de date care este generat astăzi în diferite acțiuni care Citește mai mult…

Ce tipuri de credite sunt cele mai frecvente în rândul spaniolilor?

Trăim într-o societate în care trebuie să ne confruntăm zilnic cu nenumărate cheltuieli. Cu toate acestea, lichiditatea noastră nu ne permite întotdeauna să o facem din cauza decalajului de timp care există de obicei între cât și când introducem bani și cât și când îi cheltuim. Solicitarea unui împrumut este, atunci, cea mai răspândită soluție atât pentru rezolvarea unei urgențe, cât și pentru a citi mai multe…