Data Science (DS) este un domeniu multidisciplinar care include statistica, informatica, invatarea automata (ML-Machine Learning) si expertiza in domeniu pentru a obtine cunostinte si informatii din date deja existente.
Mai multe surse inseamna mai multe date in diferite formate si tipuri, cum ar fi imagini, videoclipuri, voce, vorbire, date textuale si date numerice, atat nestructurate cat si structurate. Diferitele formate de date necesita totodata diferite metode pentru a extrage datele utile spre prelucrare din acestea, ceea ce inseamna ca datele sunt dificil de prelucrat si analizat, iar metodele traditionale de calcul nu pot prelucra aceste date.
Lucrarea de fata Data Science utilizand mediul R. Teorie si aplicatii este conceputa in ideea de a veni in sprijinul tuturor celor care doresc sa cunoasca aspecte mai mult sau mai putin analitice referitoare la stiinta datelor.
In consecinta, cartea este recomandata atat studentilor, cat si cercetatorilor si celor interesati de acest domeniu.