Microsoft Azure Machine Learning alapok

Mi is az az Azure?

A Microsoft 2008 óta fejlesztett számítási felhő platformja és infrastruktúrája. Ezzel az egyes programok nem a helyi munkaállomáson, hanem egy távoli kiszolgálón futnak. Rengeteg programozási nyelvet, keretrendszert támogat, nem csak a saját fejlesztésűeket, így sokak által megfelelő választás lehet.

Microsoft Azure

Milyen szolgáltatások érhetőek el?

Infrastructure as a Service (IaaS) és Platform as a Service (PaaS) megoldások is léteznek. Azaz kérhet a felhasználó egy nyers Windows/Linux szervert is, amit aztán saját belátása szerint használhat, de konkrét platformokat is, többek között adatbázist, web szervert, vagy akár Big Data eszközöket.
Egy hónapig ingyenesen használható a szolgáltatás, ehhez mindössze egy bankkártya és egy Microsoft Account szükséges a https://azure.microsoft.com/hu-hu/pricing/free-trial/ oldalon.

Azure Services

 

Mire való a Machine Learning?

Ahhoz, hogy ezt megértsük, először a prediktív analitikát szükséges áttekinteni:

Prediktív Analitika:

A lényege az, hogy jövendöléseket készít ismeretlen eseményekről. Ám ne tévesszen meg a neve, nem feltétlen jövőbeni eseményekről van szó, például rengeteg banki tranzakció közül a csalás felismerése is ide tartozik.
A prediktív analitika kihasználja a matematika, statisztika, adatbányászat technikáit, és a gépi tanulás nagyon fontos szerepet játszik benne.

Predictive Analytics

Több lépést kell megtenni a cél érdekében:

  • Először is fel kell mérni a helyzetet, átírni a problémát a matematika nyelvére, illetve megállapítani a feladat hatáskörét.
  • Ezután adatokra van szükség, amiket vagy be kell gyűjteni, vagy pedig már rendelkezésre állnak.
  • Amint megvannak az adatok, elkezdhetjük feltárni és előkészíteni őket, hiszen nem feltétlen megfelelő minőségű a számunkra.
  • Modellt kell készíteni a preprocesszált adatokra, itt jön képbe a Machine Learning. Az adatok egy részével megtanítjuk az algoritmust, majd a maradékon leellenőrizzük, hogy mennyire megfelelőt választottunk.
  • Ha elkészültünk, telepíthetjük az alkalmazást. Általában azonban ez többször használható, így érdemes egy web service-ként használni, hogy aztán majd mások is el tudják érni.

Machine Learning:

Ellátja a számítógépeket azzal a tudással, hogy tanuljon anélkül, hogy programoznák. Természetesen egy alapot mindenképpen adni kell neki, ez egy viszonylag nagy adathalmaz, amiből felépít magának az algoritmus egy modellt, és ez alapján próbálja meghatározni a később inputként kapott egyedek hiányzó változóit.

Data to Decisions

Erre egy példa az orvostudományban az elhalálozás várható ideje. Ha visszamenőleg sok emberről megvannak az adatok, például dohányzás, település, fizetés, párkapcsolat, munkakör, képzettségi szint, és természetesen az élt évek száma, akkor ezekből felállít a program egy modellt, amiből meg tudja mondani egy ember várható élettartamát az adatai alapján.

Vegyük az előbbi adathalmazt, ám most keressünk kapcsolatot az emberek között, azaz csoportokat, és soroljuk be az új embereket a meglévőekbe. Fontos, hogy itt nincsen előzetes információnk a csoportokról.

Ezáltal a gépi tanulást két fő részre oszthatjuk: felügyelt, és felügyelet nélküli tanulásra.

Felügyelt gépi tanulás:

Ide tartozik az első példa, ahol megvolt egy cél változó, a várható élettartam, és ez közvetlenül megtalálható a tanító adatbázisban. Így az algoritmus megtanulta ezeket, majd alkalmazta az új adatokra.
Tipikus alcsoportja a regresszió, ahol egy számértéket becslünk a meglévő kulcs-érték párok alapján, például egy ingatlan árát a piacon területe alapján.
Szintén gyakori az osztályozás, ahol mondjuk, be kell sorolni, hogy a levél spam-e vagy sem.

Felügyelet nélküli gépi tanulás:

Itt nincs meg explicite az információ, a módszernek magától kell felfedni az adatok alapján a belső struktúrákat, azaz klasztereznie kell. Például egy szociális hálózatban felderíteni az azonos érdeklődési körrel rendelkező egyedeket.

Az Azure Machine Learning tehát egy felhő alapú megoldás, ahol nem kell bajlódni a hardverrel, szoftverrel, biztonsági frissítésekkel, hanem egyszerűen egy webes grafikus felületről mindent meg lehet oldani.

Azure Machine Learning Studio

Ezt a feladatot az Azure Machine Learning Studio látja el, ahol drag ’n drop módszerrel össze lehet rakni egy modellt, de ha ez túl nagy korlátot szab, akkor az R és a Python programozási nyelveket is fel lehet használni összetettebb feladatokra. Az adatok SQL lekérdezésekkel is elérhetőek.

Leave a Reply