Azure Machine Learning algorithm choice

Posted on November 17, 2015 by Imre Kiss

Oké, milyen algoritmust is kellene választanom a kísérletemben? Alapvetően sok-sok tényezőtől függ (méret, minőség, az adatok típusa, mit akarok kezdeni a kapott eredménnyel, hogyan tudom az adatokat a gép számára legjobban átadni és igazából mennyi időm is van arra, hogy eljátszadozzak az adatokkal). valójában még nagy tapasztalattal rendelkező ML guruk sem képesek minden egyes helyzethez megmondani, hogy melyik algoritmus fogja a legjobb eredményt adni az adott problémára (Ugye milyen jó, hogy néhány kattintással módosíthatunk mindent az ML Studióban? :D).

A nehéz fegyverzet

A Microsoft összeállított egy segédletet, ami megadja a kellő támogatást ahhoz, hogy ezen az aknamezőn átsétáljunk és minél jobb algoritmust válasszunk. Ez persze nem egy olyan dolog, hogy na akkor én ezt akarom csinálni ahhoz pedig pont az az algoritmus kell, sajnos vagy szerencsére nem. Sok algoritmus nincs is felsorolva benne, ezért csupán egy rendes útmutatást kapunk a nagyoktól, hogy ne lőjünk teljesen mellé a dolgoknak. Ez az egész segédlet nem csupán a Microsoft által kigondolt irányvonalak alapján készült, hanem nagy mennyiségű visszajelzések is alakítottak rajta.

Continue reading →

Saját algoritmus írása az ML Studioban

Posted on November 15, 2015 by Péter Paluska

Időnként szükséges lehet, hogy egyedi transzformációkat hajtsunk végre az adatokon. Ilyenkor lehet hasznos valamelyik támogatott nyelven implementálni.

R nyelven:

Execute R Script:

Segítségével elvégezhetünk egyedi transzformációkat az adatainkon, a saját metrikáink szerint építhetjük fel, illetve értékelhetjük ki a modelleket. Continue reading →

Azure ML Studio and experiments

Posted on November 10, 2015 by Imre Kiss

Tudjuk, hogy hogyan vigyünk fel adatokat az ML Studio-ba. Most dolgozzunk az adatokkal. A Studióban nagyon könnyen hozhatunk létre kísérleteket (erről már beszéltem egy korábbi bejegyzésben), egyszerű drag-n-drop módszerrel illesztjük össze a megfelelő modulokat, melyből a végén egy értelmes modell áll össze. A Studió számos előre rögzített szerszámot biztosít számunkra, legyen szó tesztelésről, adatmanipulációról vagy tanító algoritmusról. Azonban ha valamivel nem vagyunk kellőképpen megelégedve, vagy szükségünk van egy egyedi megoldásra akkor sokmindent felüldefiniálhatunk, lecserélhetjük saját megoldásunkkal, amelyeket R vagy Python kódban írhatunk meg.

A munka elkezdéséhez csupán két dologra lesz szükség:

egy böngészőre (hiszen a teljes Azure ML Studió a felhőben fut, nincs szükségünk telepítésre vagy egyéb lokális konfigurációkra).
és a tanító adatokra (hiszen adatok nélkül nem sok értelme van bármit is csinálni)

Continue reading →

Adatok transzformálása a Studioban

Posted on November 8, 2015 by Péter Paluska

1norm A Normalize Data modul segítségével az adatainkat azonos volumenűre hozhatjuk. Erre akkor van szükség, ha nagyságrendbeli különbségek vannak köztük. A kisebb skálájú adatokat kevésbé veszik fontosnak az algoritmusok, hiszen ott jóval kisebb eltérés van, így hajlamosak szinte „megfeledkezni” róluk. A normalizálással viszont azonos mértékűre hozhatjuk az egyes adatokat, így azonos lesz a „súlyuk” is.

Continue reading →

Azure ML Studio

Posted on October 25, 2015 by Péter Paluska

ML Studio

A gépi tanulásra a Microsoft megoldása az ML Studio. Teljes mértékben a felhőben futó alkalmazás, így semmiféle telepítést nem igényel, bárhonnan elérhetjük a https://studio.azureml.net címen.

Nagyban megkönnyíti a munkát, hogy az egyes modulokat csak behúzzuk a munkaasztalunkra, és összekötjük őket, nem kell időt fecsérelni sok programozásra. Rengeteg gyakran használt összetevő készen van, csak paraméterezni kell őket:
Adat bemenet/kimenet, szűrők, szétválasztók, skálázók, illetve természetesen algoritmusok osztályozásra, regresszióra, klaszterizálásra, anomáliák felfedezésére.

Körbenézhetünk a Cortana Analytics Gallery-ben, ahol kész megoldásokat találhatunk gyakori problémákra:
arcfelismerés, lemorzsolódás, kézíráselemzés…

Természetesen, ha úgy érezzük, hogy nincsen számunkra megfelelő eszköz, mert egyedi dologra van szükségünk, bővíthetjük a programunkat R és Python szkriptekkel.

A továbbiakban megnézzük, hogyan lehet egy kísérletet megcsinálni elejétől a végéig, milyen alap egységeket lehet felhasználni a sikeres jóslás érdekében.

Continue reading →

Azure Machine Learning Studio and data import

Posted on October 13, 2015 by Imre Kiss

Az előző bejegyzésemben megnéztük, hogy mi is az a Machine Learning és egy kicsit bővebben tárgyaltuk a Supervised Learning elméletét is. (Most egy kicsit gyakorlatiasabb téma jön.)

Azure Machine Learning

A Microsoft Azure szolgáltatásban az ML rendkívül egyszerűen elérhető , és nagyon egyszerűen használható az Azure ML Studio webes környezet segítségével.
A rendszer egy “fogd és vidd” (maradjunk az angol drag-and-drop kifejezésnél) módszerrel lehet használni (azaz nem igényel túlzott kódolási tudást MÉG). A drag-and-drop módszerrel lehet egy “kísérletet” felépíteni, tesztelni és telepíteni, alkalmazni a saját adatainkon. A Studio képes a szépen felépített modellünket egy webes szolgáltatásként publikálni, így az könnyen felhasználható akár mások által is.

Mit kell tenni azért, hogy elkezdjük a munkát az Azure ML Studio felületén?

Hasznos ha rendelkezünk Azure accounttal, így csak egyszerűen bejelentkezünk (ha nem rendelkezünk windows LiveID-val akkor itt van lehetőség az elkészítésre). Azonban a rendszer ingyenesen kipróbálható egy hónapig. Mind a két opció a következő linken érhető el: Azure ML Studio

Continue reading →

Azure Machine Learning and Supervised Learning

Posted on October 8, 2015 by Imre Kiss

Mi is az a Machine Learning?

Mit jelent pontosan a Machine Learning (későbbeikben ML)? Ma az ML egy csomó dolgot jelent. A terület elég nagy, és gyorsan növekszik, mert folyamatosan megosztjuk és vég nélkül ágaztatjuk a különböző szakterületeket és az ML típusait.

Úgy lehetne megfogalmazni, mint egy olyan rendszer, ami a tapasztalatokból fejlődik, vagy egy olyan metódus, amely az adatot szoftverré alakítja. A lényeg minden szempontból ugyanaz, a modern adattudomány sikeresen kifejlesztette a szoftver modellek létrehozásának olyan folyamatát, amelyek óriási adathalmazokból tanulva pontos mintákat és értékeket “jósolnak” számunkra.

Tom Mitchel 1997-ben adott egy tökéletes megfogalmazást: “Egy számítógépes program tanul a tapasztalatokból, ha a programot a tapasztalati példák feldolgozása után ismételten lefuttatva bizonyos teszt feladatokon, a program teljesítménye javul.“

Continue reading →

Connect to SQL server

Posted on April 10, 2015 by Tamás Lévai

Ebben a posztban meg fogom mutatni, hogyan kell kapcsolódni egy SQL szerverhez Visual Studio használatával
Adott projektünkön belül kattintsunk a models-re majd add -> new Item:

Válasszuk az ADO.NET Entity Data Model lehetőséget:

Válasszuk az EF Designer from database lehetőséget: (ebben az esetben már az sql szerver meg van írva, mi csak használni szeretnénk)

Majd New Connectionra kattintva:

úgy csatlakozunk az sql szerverhez, ahogy ebben a posztban tettük:

Ha a beírt adatok helyesek, akkor a VS felsorolja az SQL szerveren található adatbázisokat, én a Database adatbázist fogom használni:

Válasszunk biztonsági szintet: (én a kódba beleírtam a csatlakozási jelszót is,ahogy a képen látszik)

Majd válasszuk ki, melyik táblát szeretnénk importálni:

Ezt kiválatsztva létrejön a fizikai kapcsolat az adatbázis szerverrel,amit egy fizikai modelként (edmx) ment el. Model réteg nekem most így néz ki:

Nézzük meg mi is történt a háttérben. Web.config fájlba került bele egy új adatbázis kapcsolódási pont. A képen sárgával kiemeltem:

Add migration

Posted on April 10, 2015 by Tamás Lévai

Ha szeretnénk bővíteni az AspNetUser táblát saját “tulajdonságokkal” a következőeket kell tennünk:
Esetünkben Deleted tulajdonsággal bővítünk:
-használjuk a System-et:

Az egyedünk a DbMigration-ból származtatjuk:

Majd parancssorban bekapcsoljuk a migrációt az Enable-Migrations paranccsal:

Hozzáadjuk az AspNetUser táblához az új tudlajdonságunk:

Frissítjük az adatbázist:

Esetleges változtatásokat elvégezzük a view részen is, de esetünkben ez rejtett tulajdonság, ezért nem kell megjeleníteni.
Mostantól használhatjuk az AspNetUser táblát a hozzáadott új tulajdonságával együtt.

A nehéz fegyverzet

R nyelven:

Execute R Script:

Azure Machine Learning

Mit kell tenni azért, hogy elkezdjük a munkát az Azure ML Studio felületén?

Mi is az a Machine Learning?

Mi is az az Azure?

Milyen szolgáltatások érhetőek el?