Certo, sarebbe bello studiarli tutti e quattro. Ma se hai appena iniziato, vale la pena iniziare con uno o due. Le opzioni più comunemente consigliate sono Python e SQL. Con il loro aiuto, sarà possibile coprire il 99% del processo di lavoro con dati e problemi analitici.

Contents

Python Data Science Handbook PDF I libri finanziari
Quando arriva il momento di imparare il codice per lavorare con i dati, dovresti concentrarti su questi 4 linguaggi: SQL, Python, R, Bash.

Il Python Data Science Handbook (scarica: https://python.engineering/python-data-science-handbook/) è una guida completa a un`ampia varietà di metodi computazionali e statistici, senza i quali è impensabile qualsiasi elaborazione dati ad alta intensità di dati, ricerca scientifica e sviluppo avanzato. Lettori che hanno già esperienza di programmazione e desiderano utilizzare in modo efficace Python nel campo della Data Science troverà le risposte a tutti i tipi di domande in questo libro, ad esempio:

  • Come faccio a leggere questo formato di dati nel mio script?
  • Come trasformare, pulire e manipolare questi dati?

Se stai studiando Data Science, ti imbatterai presto in Python. Come mai? Perché è uno dei linguaggi di programmazione più utilizzati per lavorare con i dati. È popolare per molte ragioni.
Questa guida ti guiderà attraverso tutto ciò che c`è da sapere, a partire dalle basi. Anche se non hai mai lavorato con il codice, sei sicuramente nel posto giusto. Sarà interessata solo quella parte del linguaggio correlata alla scienza dei dati: eviteremo sfumature inutili e poco pratiche. E alla fine, creeremo sicuramente qualcosa di interessante, ad esempio l`analisi predittiva.

Questa è una guida pratica!

Fare qualcosa seguendo le istruzioni è sempre più gratificante della semplice lettura. Se ripeti tu stesso le parti che contengono il codice, digitandolo sul tuo PC, capirai e ricorderai tutto 10 volte meglio. E alla fine dell`articolo ci saranno sicuramente uno o due esercizi da testare!

Perché imparare Python per la scienza dei dati?

La parte teorica sarà breve. Ma devi sapere due cose sulla lingua prima di iniziare a usarla.

Python è un linguaggio generico e viene utilizzato non solo per la scienza dei dati. Ciò significa che non è necessario conoscerlo perfettamente per essere un esperto di dati. Allo stesso tempo, anche le basi saranno sufficienti per comprendere altre lingue, il che è molto comodo per lavorare nell`IT.
Python è un linguaggio di alto livello. Ciò significa che non è il più efficiente in termini di tempo di CPU. D`altra parte, è stato progettato per essere molto semplice, "facile da usare" e comprensibile. Quindi, anche se perdi in tempo di CPU, puoi vincere nel processo di sviluppo.

Conclusioni

Ti sei accorto che stavi programmando in Python 3? Non era così facile e divertente?

La buona notizia è che, per il resto, Python è altrettanto semplice. La complessità nasce dalla combinazione di cose semplici... Ecco perché è così importante conoscere le basi! Nella parte successiva, Python for Data Science, imparerai a conoscere le strutture dati più importanti in Python.