Az adattudomány és a gépi tanulás 11 legjobb forrása

Az adatok az új olaj. És a gépi tanulás a tűz. Aki irányítja ezt a kettőt, az irányítani fogja a világot.

Nem, a fenti nem valami nagyképű kifejezés, amelyet egy disztópikus regényből vettek fel.

Ez valóság.

Az új világrend arról szól, hogy hatalmas mennyiségű releváns adatot gyűjtsenek össze, és azokat hasznosítható betekintésekké dolgozzák fel – amire az emberi faj a történelem során nem volt képes. Ez az a fajta technológia, amely lehetővé teszi egy ország számára, hogy megelőzze a többieket, és végül uralja a világot.

Ennek eredményeként a világ haladó nemzetei nagyon-nagyon komolyan veszik.

Jövedelmező pályaválasztás

A nemzetközi intrikáktól eltekintve az adattudomány és a gépi tanulás egy új, forró terület hihetetlen lehetőségekkel. A kereslet (enyhén szólva) elmarad a listáktól, és nincs elég adattudós a környéken. Még a közepeseket sem.

Mintha hirtelen sok új, lakható bolygót fedeztünk volna fel, és nincs elég ember, ahová elköltözhetnénk. Folytathatnám és úgy hangozhatnék, mint egy megdőlt lemez, de szerintem ez az infografika sokkal jobban teljesíti a feladatot:

Forrás: insidebigdata.com

Tehát azt látjuk, hogy a fizetések 50 000+ dollárnál kezdődnek, a menedzserek fizetése pedig jóval 250 000 dollár fölé is emelkedhet.

És nem csak ez, az átlagember ezen a bolygón másodpercenként 1,7 MB adatot generál. Ez több mint 3500 TB adat a teljes élettartam alatt – több adat, mint amennyit jelenleg tudunk kezelni, nem is beszélve arról, hogy elemzésre használjuk. Ha azt mondanánk, hogy a jövő fényes, rossz szolgálatot tennénk ennek a csodálatos új legelőnek.

Nehéz az adattudomány és a gépi tanulás?

Jó kérdés!

Tapasztalataim szerint a válasz „igen” és „nem” is.

A mesterséges intelligencia (és tágabb értelemben a gépi tanulás) a legnehezebb dolog, ha hajlamos kutatásba kezdeni, és túltenni a keretet. Az ilyen munkához még a Ph.D. informatikából és matematikából nem elég. De hát az átlagembernek sem ambíciója, sem ideje nincs ilyen törekvésre.

A másik véglet az, amit én alkalmazott adattudománynak és gépi tanulásnak neveznék.

Ez azt jelenti, hogy a meglévő eszközöket, technikákat és algoritmusokat alkalmazza néhány valós probléma megoldására. Ez a rész elhivatottságot, felfogást és kreatív gondolkodást igényel (és néhány egyszerű matematikai fogalom ismeretét, amelyeket gyorsan megtanulnak), de a valódi „műszaki” tudás tekintetében sokkal engedékenyebb, mint amit egy szoftvermérnöki munkakörnek nevez.

Más szóval, ez nem egy kis tortúra, hanem a jutalom és az erőfeszítés aránya szerint az egyik legjobb befektetés.

  A Zoom-hívás hibáinak elhárítása

Most, hogy megerősítette elhatározását, hogy adattudóssá és gépi tanulási mérnökké váljon, kezdjük el felfedezni a legjobb lehetőségeket.

Gépi tanulás (Google)

Nem sokan tudják, de a Google kiterjedt, rendkívül praktikus és ingyenes tanfolyam a gépi tanulásról. A vállalat szerint ez része az AI/ML technológiák fejlesztése és a tudás nyilvánosság előtt tartása iránti elkötelezettségüknek.

A legjobb ebben a kurzusban az, hogy nincsenek előfeltételek, de készülj fel arra, hogy több időt tölts a statisztikai fogalmak önálló felfedezésével.

Úgy értem, nincs rá szükség, de ha nulla háttérrel rendelkezik a haladó statisztikában, akkor előfordulhat, hogy a kurzus magyarázata nem lesz elegendő. Egy másik érdekesség, hogy ez a kurzus bemutatja a gépi tanulást a következőn keresztül TensorFlow, amely a Google által kifejlesztett ML implementáció. Tehát bizonyos értelemben a Google célja a gépi tanuláshoz használt API-k népszerűsítése, de figyelembe véve a kurzus által kínált értéket, nem látom, hogy ez botláskő lenne.

Ha valami, a TensorFlow az egyik egyszerű módja annak, hogy bejusson az ML-be, és őrjöngő népszerűségnek örvend (az AI-keretrendszerek összehasonlításához lásd ezt).

Adattudomány

A Harvard név félelmet kelt, és ez a tanfolyam is.

Először is: ez nem egy „piszkáljunk be”-gyors tanfolyam, ahol a gépi tanulást úgy tipródja, hogy ide ír egy részletet vagy egy szkriptet. Ez a tanfolyam komoly tűzkeresztség, amely kemény munkát és jelentős időbefektetést igényel.

A kurzus ingyenes videókkal, kóddal (a GitHubon tárolt) és laborgyakorlati megoldásokkal érkezik, így gyakorlatilag semmi sem korlátozza, ha el akarja vinni.

Ideális közönség?

Te… nem viccelek.

Azt mondanám, hogy tisztességes matematikai végzettséggel rendelkező dolgozó szakemberek, bár lehet, hogy már nem értenek a matekhoz (a következtetés és a bizonyítás szokásai a legszükségesebbek). De még egyszer, kérem, figyelmeztessen: azt gondolhatja, hogy jó vagy, de ezen a tanfolyamon olyan érzés lesz, mintha megkeményedett körmök reggeliznének – a gyakorlati problémák elég nagy kihívást jelentenek ahhoz, hogy elsírja az embert, de akkor lehet, hogy pontosan ez a baj. keresed!

Gépi tanulás

Lépjen be egy adattudósokkal teli bárba, és kérdezze meg, ki az Andrew Ng, és meglesz az élete.

Az adattudomány és a gépi tanulás köreiben Andrew Ng istenszerű státuszt ért el a Coursera-n végzett kivételes tanfolyamának köszönhetően – Gépi tanulás.

És ha kételkedsz Andrew Ng hitelességében, hagyom, hogy ez önmagáért beszéljen:

Ez egy fizetős tanfolyam, mivel része a Coursera árképzési tervének, de nem csak a pénzügyi elkötelezettség és az elszántság az előfeltétel. Ez egy hosszú tanfolyam, mivel Andrew mélyen belemerül az ML mögött meghúzódó matematikába, és népszerű algoritmusokat boncolgat. De szerencsére ez egy teljes tanfolyam, és lépésről lépésre elvezetnek a legsötétebb mélységekbe, és visszahoznak.

  Hogyan működik az interaktív történetmesélés a Netflixen?

Bátran ajánlom, főleg azért, mert a tanfolyam elvégzési bizonyítványának fitogtatása mára döbbenetessé vált!

Alkalmazott adattudomány

A Coursera szakirányai kurzusok sorozatából állnak, amelyek célja, hogy a nulláról egy adott koncepcióban jártassá váljon. Ha egy teljes, komoly, de barátságos tanfolyamot keres az adattudományról és a gépi tanulásról Pythonnal, akkor ezt nem tudom ajánlani szakosodás elég.

A tanfolyam végén bizonyítványt kapsz.

DataCamp

DataCamp rengeteg adattudományi kurzust kínál, amelyek számos készség- és karrierpályát is tartalmaznak. Az adatmanipulációtól a gépi tanulásig, karrierépítő adattudós készségekre tesz szert Python és R nyelvekben, amelyek elősegítik, hogy sikeresek legyünk az adattudomány területén.

A DataCamp bájt méretű tartalmával saját tempójában tanulhat. Ezek a kurzusok gyakorlati tapasztalatot nyújtanak, amelyen keresztül fejlesztheti adattudományi készségeit.

Kezdheti az ingyenes verzióval, és az első fejezet alapján értékelheti a kurzust.

edX

Tanuljon a MITx-től, a Harvardx-től, az IBM-től, a RICEx-től, az UCSanDiegox-tól és a GTx-től edX platform.

Mindegyikük átfogó tantervvel rendelkezik, amely segít az adattudós-készségek birtokában. Ezek a programok a legalkalmasabbak azok számára, akik statisztikai vagy számítástechnikai háttérrel rendelkeznek.

Ha nem keresel programot, választhatsz egy ala-carte-ot. Az edX-en több mint 200 adattudományi kurzus található, amelyek a Python, az R, az Excel, a valószínűségszámítás, a statisztikák, a gépi tanulás, az adatvizualizáció és még sok más témakört lefedik.

Codecademy

A Codecademy egy másik platform, amely az egyik legjobb rendszer, amely segít megtanulni kódolni. Hisznek a „Cselekvéssel tanulni”, és rengeteg gyakorlati projekt és teszt van a platformjukon.

Az adattudományi tanfolyam A Codecademy által kínált SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn és még sok más könyvtárat tartalmaz.

A teljes karrierút 26 tanfolyamot tartalmaz, amelyek több mint elegendőek ahhoz, hogy sikeres adattudóssá váljon.

Ez az adattanfolyam:

  • Mélyreható ismereteket nyújt az adattudományról
  • Könnyen követhető ütemtervet biztosít
  • Felkészíti a munkára azáltal, hogy segít elegendő gyakorlati tapasztalat megszerzésében

Udemy

Udemynek nincs szüksége bemutatásra.

Python for Data Science and Machine Learning Bootcamp Az on Udemy az egyik legnépszerűbb kurzus, több mint 85 000+ 4,6-os besorolással, és 370 000+ diák vett részt szerte a világon.

Az alábbiakban felsoroljuk a kurzusban tárgyalt témákat:

Az alábbiakban a kurzus jellemzői/leadható részei találhatók:

  • 25 óra igény szerinti videók
  • Teljes élettartamú hozzáférés
  • 13 cikk és öt letölthető forrás
  • Hozzáférés mobilon és TV-n
  • Teljesítési igazolás
  • 30 napos pénzvisszafizetési garancia

Tehát, ha egy költségvetési tanfolyamot részesít előnyben, ez lenne a legalkalmasabb az induláshoz.

Google AI

Érdekelné a gépi tanulás tanulása a Google ML szakértőitől?

Nos, akkor meg kell nézni a tanfolyamokat Google AI.

Ezen a platformon gépi tanulási és adattudományi kurzusok és tartalom található diákok, szoftvermérnökök, adattudósok és még kutatók számára. Ezek a tanfolyamok ingyenesek.

  Biztonságos, csak megtekintés, önmegsemmisítő fájlmegosztás

Kezdjük azzal, Gépi tanulás gyorstanfolyam a Google AI-nál a kurzusodnak kell lennie. Ez egy gyors tempójú tanfolyam gyakorlati bevezetéssel a TensorFlow API-k használatával. Az alábbiakban a tanfolyam részleteit olvashatja:

Ezen a platformon speciális tanfolyamok is találhatók olyan fontos gépi tanulási témákról, mint pl klaszterezés, ajánlási rendszerek, tesztelés és hibakeresés a gépi tanulásban, adatszétválasztás és funkciótervezés a gépi tanulásban. Ha már ismeri a gépi tanulás alapjait, ezek a tanfolyamok hozzáadott értéket képviselnek.

Udacity

Az Udacity egy nagyon népszerű e-learning platform is, amely rengeteg kurzussal rendelkezik a felkapott technológiákról. Számos iparágvezető programmal rendelkezik, amelyeket világszerte vezető cégek építettek és ismernek el, mint például az AT&T, AWS, Google, IBM.

Az Udacity egyik programja az adattudománynak szól – Adattudományi Iskola. Ez a program segít adatelemzői, adattudósi, adatmérnöki és üzleti elemzői állások betöltésében. Ebben a programban a Data Scientist tanfolyam a kulcsfontosságú, amely magában foglalja a gépi tanulás, a mély tanulás és a szoftverfejlesztés fogalmait. Ennek a tanfolyamnak a kiválasztásához alapvető gépi tanulási ismeretekkel kell rendelkeznie.

Ha ismeri a python programozást, de új a gépi tanulásban, van egy másik program az Udacity-n – AI Iskola. Ez a program tanfolyamokat tartalmaz a gépi tanulás alapjaitól kezdve.

Mély tanulás

Ez a tanfolyam áldás, és ez a legkedvesebb ajánlásom ezen a listán, ha kódoló vagy.

Még egyszer elmondanám: ha kódoló vagy.

Ennek az az oka, hogy ez a kurzus nem tölt időt azzal, hogy megtanítsa a programozás alapjait. A kurzus leírása nagyon világosan mondja ezt (a kiemelés az eredeti):

Feltételezzük, hogy mindenki, aki részt vesz ezen a tanfolyamon, rendelkezik legalább egy éves kódolási tapasztalattal. A kurzus a python nyelvet használja tanítási nyelvként, így ha még nem ismeri a pythont, akkor feltételezzük, hogy időt fordít a tanulásra – egy tapasztalt kódoló számára azt kell tapasztalnia, hogy a python meglehetősen könnyen megtanulható nyelv.

Tehát ha már ismeri a Python-t (ha nem tanulj itt), vagy gyorsan elkényelmesedhet, ez a tökéletes kurzus azoknak a pragmatikusoknak, akik valódi, használható rendszereket szeretnének építeni anélkül, hogy túl sokat törődnének az algoritmusok elméleti alapjaival.

Sőt azt is mondhatnám, hogy a türelmetlen bütyköknek (mint én!), akik utálják a szertartást és az egyhangúságot.

És oh, említettem már, hogy 100%-ban ingyenes, és nagyszerű közössége van?!

Következtetés

Fú!

Ezt a listát nehéz volt összeállítani. Nem azért, mert nem volt elég jó forrás, hanem mert túl sok volt!

A gépi tanulás egy olyan tartomány, amely szó szerint felrobbant, és nagyon elegánsan oldja meg a nehéz problémákat, így több száz ingyenes és fizetős online kurzus létezik, amelyek többsége nagyon-nagyon jó. Ez azonban zavart is okozhat, ezért próbáltam tizenegyre lefaragni a különböző típusú tanulók számára, tapasztalati szintjük szerint.

Remélem segített!