7 sammu masinõppesse: kuidas valmistuda automatiseeritud tulevikuks

Pilt: Sdecoret / Shutterstock

Järjest digitaalsemaks muutuv majandus nõuab, et juhatused ja juhid tunneksid kiiresti muutuvat digitaalset maastikku. Loomulikult on tehisintellekt (AI) oluline sidusrühm. Need organisatsioonid, kes soovivad automatiseeritud tulevikuks valmistuda, peaksid AI-st põhjalikult aru saama. AI on siiski katustermin, mis hõlmab mitut eriala, millest igaüks mõjutab ettevõtet veidi erineval viisil.

Kui vaadata tehisintellekti, võib selle jagada kolmeks erinevaks valdkonnaks:

  1. Robootika, mis tegeleb füüsilise maailmaga ja suudab inimestega vahetult suhelda. Robootikat saab kasutada meie töö parendamiseks mitmel viisil. Sealhulgas Fordi eksoskelett või Boston Dynamics abistavad robotid.
  2. Inimese maailma käsitlevad kognitiivsed süsteemid. Suurepärane näide kognitiivsest süsteemist AI osana on jututoad. Vestlusbotid on väga käegakatsutav näide, kus inimesed ja masinad töötavad eesmärgi saavutamiseks koos. Vestlusbot on suhtlusliides, mis aitab inimestel ja organisatsioonidel vestelda.
  3. Masinõpe, mis tegeleb infomaailmaga. Masinad kasutavad õppimiseks andmeid ja masinõppimise eesmärk on neist andmetest tähendus saada. Masinõppes kasutatakse statistilisi meetodeid, mis võimaldavad masinatel masinatega paremaks muutuda. Masinõppe alamhulk on süvaõpe, mis võimaldab mitmekihilisi närvivõrke.

Tehisintellekt koosneb robootika, kognitiivsete süsteemide ja masinõppe sujuvast integreerimisest.

Joonis 1: tehisintellekt - kohandatud ajakirjast Goel & Davies, 2019

7 sammu masinõppesse

Sukeldugem pisut sügavamalt ühte järgmistest valdkondadest: masinõpe. Masinõppe eesmärk on tuletada andmetest tähendus. Seetõttu on andmed masinõppe avamise võti. Masinõppel on seitse sammu ja iga samm keerleb andmete ümber:

Joonis 2: 7 sammu masinõppeni

1. Andmete kogumine

Masinõpe nõuab palju andmeid treeningute kohta (kas märgistatud, mis tähendab juhendatud õppimist või mitte, mis tähendab juhendamata õppimist). Andmete kogumine ehk andmete fikseerimine on ka minu uue D2 + A2 mudeli esimene samm.

2. Andmete ettevalmistamine

Algandmed üksi pole eriti kasulikud. Andmed tuleb ette valmistada, normaliseerida, dubleerida ning vead ja eelarvamused tuleb eemaldada. Andmete visualiseerimisel saab otsida mustreid ja kõrvalnähtusi, et näha, kas on kogutud õigeid andmeid või puuduvad andmed.

3. Mudeli valimine

Kolmas samm koosneb õige mudeli valimisest. Seal on palju mudeleid, mida saab kasutada mitmel erineval otstarbel. Mudeli valimisel peate veenduma, et mudel vastab ettevõtte eesmärgile. Lisaks peaksite teadma, kui palju mudeli ettevalmistamine nõuab, kui täpne see on ja kui skaleeritav on mudel. Keerulisem mudel ei tähenda alati paremat mudelit. Tavaliselt kasutatavad masinõppe algoritmid hõlmavad lineaarset regressiooni, logistilist regressiooni, otsustuspuid, K-vahendeid, põhikomponentide analüüsi (PCA), tugivektorite masinaid (SVM), naiivseid bayes, juhuslikku metsa ja närvivõrke.

4. Treening

Mudeli väljaõpe on suurem osa masinõppest. Eesmärk on kasutada treeningu andmeid ja täiustada järk-järgult mudeli ennustusi. Iga raskuste ja kallutuste värskendamise tsükkel on üks treeninguetapp. Juhendatud masinõppes on mudel üles ehitatud märgistatud valimisandmete abil, samal ajal kui juhendamata masinõpe püüab teha järeldusi märgistamata andmetest (ilma viideteta teadaolevatele või märgistatud tulemustele).

5. Hindamine

Pärast koolitust tuleb mudel mudelit hindama. See eeldab masinõppe testimist kasutamata juhtimisandmebaasi alusel, et näha selle toimimist. See võib esindada seda, kuidas mudel reaalses maailmas töötab, kuid see ei pea nii olema. Mida suurem on muutujate arv reaalses maailmas, seda suurem peaks olema treenimis- ja katseandmete arv.

6. Parameetri häälestamine

Pärast mudeli hindamist peaksite AI parendamiseks katsetama algselt seatud parameetreid. Treeningtsüklite arvu suurendamine võib anda täpsemaid tulemusi. Peaksite siiski määratlema, millal mudel on piisavalt hea, vastasel juhul jätkate mudeli näpistamist. See on eksperimentaalne protsess.

7. Ennustamine

Kui olete läbinud andmete kogumise, andmete ettevalmistamise, mudeli valimise, koolituse ja mudeli hindamise ning parameetrite häälestamise, on aeg vastata küsimustele ennustuste abil. Need võivad olla igasugused ennustused, alates pildi äratundmisest kuni semantikani kuni ennustava analüüsini.

Lõplikud mõtted

Masinõpe võimaldab tarkvaral tulemuste ennustamisel täpsust saada. See laiendab lähiaastatel paljusid, kui mitte kõiki äriprotsesse. Sellisena muutub masinõpe homse automatiseeritud korralduse lahutamatuks osaks. Tänu üha kiiremale riistvarale näeme võimsamaid mudeleid, mis pakuvad paremaid ennustusi.

Kahjuks pole kallutatud andmete ja kallutatud andmete teadlaste väljakutse kallutatud mudelite jaoks kunagi kaugel. Selleks, et organisatsioonid saaksid AIst tõelist kasu, peaksid nad tagama, et nende mudelid ja andmed on eelarvamustevabad, koolitatud ning hinnatud ja õigesti häälestatud. Alles siis saavad organisatsioonid masinõppest tõesti kasu.

Kui mul õnnestus teie tähelepanu sellele punktile alles hoida, jätke kommentaar, milles kirjeldatakse, kuidas see lugu teid muutis, või tellige minu iganädalane infoleht, et saada sellest sisust rohkem:

Dr Mark van Rijmenam on Datafloqi asutaja, ta on ülemaailmselt tunnustatud suurandmete, blockchaini ja AI kõneleja, strateeg ja 3 juhtimisraamatu autor: Think Bigger, Blockchain ja The Organization of Tomorrow. Minu viimase raamatu tasuta eelvaadet saate lugeda siit. Võtke minuga ühendust LinkedInis või öelge seda lugu mainides Twitteris tere.

Kui soovite minuga rääkida nõuandvatest töödest või rääkimisülesannetest, võtke minuga ühendust aadressil https://vanrijmenam.nl