Le persone che si sono trasferite in questa sfera ci raccontano in un'intervista.

Contents

Cosa fanno i data scientist? I libri finanziari
Cosa fanno effettivamente i data scientist?

La scienza dei dati è un'area popolare dell'IT di cui tutti parlano ora. Ma non tutti capiscono cosa fanno in pratica gli scienziati dei dati. In breve, elaborano enormi quantità di dati (tanto che non entrano in un foglio di calcolo Excel) e, sulla base, creano algoritmi per risolvere vari problemi: dalla creazione di previsioni del tempo e sistemi di raccomandazione per i servizi musicali allo sviluppo di chat bot intelligenti e condurre ricerche genetiche.

C'è un'enorme richiesta di data scientist qualificati tra le grandi aziende. Il lavoro interessante, la mancanza di routine e gli stipendi alti fanno pensare di cambiare lavoro non solo per le persone con un'istruzione tecnica, ma anche per le discipline umanistiche. Tuttavia, né l'uno né l'altro sanno come approcciarsi alla professione di data scientist: dove andare a studiare, come trovare un lavoro e cosa alla fine dovrà essere fatto.

Abbiamo parlato con tre laureati che hanno seguito un corso in Data Science, e abbiamo scoperto perché hanno deciso di cambiare vita, se le aspettative della nuova professione coincidevano con la realtà e quali difficoltà hanno dovuto affrontare durante il lavoro e lo studio.

Perché ho scelto Data Science

Non mi sono piaciute molto tutte le professioni che conoscevo da bambino, ma sono sempre stato attratto dai computer. In prima media, mi sono interessato alla programmazione e ho iniziato a studiare i linguaggi C++ e Python e soprattutto questo. Possiamo dire che già al 9° anno avevo una conoscenza abbastanza profonda della scrittura di codice.

Già allora mi sono reso conto che se voglio sviluppare in ambito informatico, la sola programmazione non basta. In quel momento, mi è stato offerto di partecipare a un'Olimpiade scolastica relativa alla Data Science. Lavorare con i set di dati mi ha attratto perché richiede un approccio creativo: per ogni attività è necessario trovare una soluzione originale. È qui che la scienza dei dati si differenzia dallo sviluppo del software, che utilizza all'incirca gli stessi metodi. Ma questa è la mia opinione soggettiva.

Difficoltà di apprendimento

Ci sono pochissimi corsi di formazione e informazioni davvero utili nell'open access sulla Data Science. La decisione di studiare data scientist presso SkillFactory è arrivata dopo che ho seguito un corso di tre mesi in programmazione Python con loro. Mi è piaciuto il formato remoto e il modo in cui è strutturato il curriculum.

Sapevo già programmare ed ero fiducioso nelle mie capacità, quindi l'unica cosa che mi ha confuso durante il corso è stata la sezione con la matematica superiore. È stato molto difficile per me, quindi a volte mi sono rivolto ai mentori per chiedere aiuto. La loro risposta potrebbe arrivare istantaneamente o il giorno successivo.

Anche altri studenti mi hanno aiutato. In generale, ci sono molte gare a squadre sul percorso, perché il data scientist non lavora quasi mai da solo. Gli argomenti del concorso sono completamente legati alla Data Science. Ad esempio, c'è stata una competizione per l'analisi delle serie temporali. Python mi ha aiutato molto.

Come il progetto di laurea ha contribuito a migliorare le competenze di un data scientist

Per quasi due anni che mi occupo di Data Science, il compito più difficile per me è stato il mio progetto di laurea su os.path.isdir - "Previsione dei prezzi degli immobili utilizzando l'apprendimento automatico". Il programma che ho realizzato ha preso i dati su un oggetto specifico: posizione, numero di piani, superficie dell'appartamento e numero di stanze - e ha costruito previsioni del costo di questo alloggio sulla base di essi.

La parte più difficile, ma anche la più interessante del progetto, è stata il complesso formato dei dati. È facile lavorare con le informazioni nello stesso formato. Ad esempio, quando i numeri sono raccolti ordinatamente in una tabella. Ma se ci sono firme o simboli, devono essere puliti, e questo è molto difficile. Fondamentalmente, mi trovavo di fronte a una vasta gamma di dati non strutturati. Il progetto di laurea ha richiesto molto tempo, ma è stato lui a sviluppare le competenze che prima mancavano. Il compito mi ha costretto ad applicare le soluzioni più sofisticate, alle quali difficilmente avrei pensato prima.

Sono diventato più dettagliato in tutte le "caratteristiche" di Data Science e ho imparato a padroneggiare nuovi strumenti, ad esempio hyperopt per la selezione automatica degli iperparametri o il correttore ortografico per correggere l'ortografia nelle parole. Ho anche rafforzato la mia conoscenza di materiali che non mi erano del tutto chiari durante il corso.

Il formato del diploma era nuovo per me, quindi i mentori hanno aiutato principalmente con il design della presentazione. In ogni fase del lavoro, ho ricevuto un elenco di errori e carenze che devono essere corretti. Lo stesso vale per il codice. Potresti sempre chiedere aiuto, ma volevo sistemare le cose da solo. Almeno dove possibile.