Birthmarks data #3 – feature selection

Miután az adatainkat rendeztük, szétvágtuk, alakítottuk, kezdhetjük a megfelelő Feature halmaz meghatározását. Mint már tudjuk, ehhez maga az Azure is számos megoldást kínál, de csinálhatjuk ezt manuálisan is (ha tudunk valami olyat amit a gép nem 😀 ). Tehát az anyajegyek adathalmazunkban jelenleg mik lesznek a meghatározó feature elemek, amelyeket az osztályozáshoz fogunk használni?

Continue reading

Birthmarks data #2 – separation

Az előző postban eljutottam addig, hogy az adatokat kicsit módosítottam és a több osztályos tanulásból kétosztályos tanulást csináltam. Most ismét a későbbi könnyebb munka és egy kicsit az eredmények javítása céljából tovább bontottam az adathalmazt. Azaz teljesen különálló adathalmazt hoztam létre a tanuló és a teszt adatoknak. Ez azt jelenti, hogy mind a BENING és a MALIGNANT halmazból véletlenszerűen kiválasztottam 5 db sort tesztadatnak.

Continue reading

Azure Machine Learning Studio and data import

Az előző bejegyzésemben megnéztük, hogy mi is az a Machine Learning és egy kicsit bővebben tárgyaltuk a Supervised Learning elméletét is. (Most egy kicsit gyakorlatiasabb téma jön.)

Azure Machine Learning

A Microsoft Azure szolgáltatásban az ML rendkívül egyszerűen elérhető , és nagyon egyszerűen használható az Azure ML Studio webes környezet segítségével.
A rendszer egy “fogd és vidd” (maradjunk az angol drag-and-drop kifejezésnél) módszerrel lehet használni (azaz nem igényel túlzott kódolási tudást MÉG). A drag-and-drop módszerrel lehet egy “kísérletet” felépíteni, tesztelni és telepíteni, alkalmazni a saját adatainkon. A Studio képes a szépen felépített modellünket egy webes szolgáltatásként publikálni, így az könnyen felhasználható akár mások által is.

Mit kell tenni azért, hogy elkezdjük a munkát az Azure ML Studio felületén?

Hasznos ha rendelkezünk Azure accounttal, így csak egyszerűen bejelentkezünk (ha nem rendelkezünk windows LiveID-val akkor itt van lehetőség az elkészítésre). Azonban a rendszer ingyenesen kipróbálható egy hónapig. Mind a két opció a következő linken érhető el: Azure ML Studio

Continue reading