Datan louhinta ja tietämyksen muodostaminen
Sisältö:
Viimeaikainen tekninen kehitys on johtanut datamäärän
kasvuun. Puhutaan ns. ``data explosion'' ongelmasta,
joka on aiheutunut seuraavien kehitystekijöiden summana:
- Dataa voidaan kerätä ja siirtää nopeasti.
- Massamuistien tallennuskapasiteetit ovat kasvaneet.
- Massamuistien hinta/talletussuhde on laskenut.
- Tietokoneiden suorituskyky on kasvanut.
Datan louhinta- ja tietämyksen muodostamismenetelmillä
pyritään annetusta datasta saamaan esille oleellinen
informaatio kutakin tarkoitusta varten. Nämä menetelmät
sisältävät mm.
- Ryhmittelyä.
- Luokittelusääntöjen oppimista.
- Riippuvuuksien havaitsemista.
- Muutosten analysointia.
- Säännöllisyyksien ja säännöttömyyksien havaitsemista.
- Tietämyksen esittämistä.
Seminaarissa läpikäydään uusimpia tähän ongelmakokonaisuuteen
liittyviä datan louhinta- ja tietämyksen muodostamistekniikoita.
Kirjallisuus:
Seminaari pohjautuu kirjaan:
Materiaalia Webissä:
Aikataulu (12.3.1998 versio):
Ensimmäinen kokoontuminen oli tiistaina 3.2. jolloin jaettiin kullekin
osallistujalle oma seminaariaihe ja opponoitava esitelmä.
Esitelmät pidetään oheisina päivinä klo 14-16 Laskennallisen tekniikan
laboratorion seminaarihuoneessa
(kartta).
| Päivä | Esittäjä | Opponentti | Aihe | Esitelmät
|
| 3.3. | M. Varsta | J. Himberg | Kirja: 1. luku | PostScript
|
| 10.3. | T. Kostiainen | A. Vehtari | Kirja: 6. luku | PostScript
|
| 24.3. | T. Koskela | J. Juujärvi | Kirja: 5. luku | PostScript
|
| 24.3. | J. Vesanto | J. Kulju | Kirja: 4. luku | PostScript
|
| 31.3. | J. Himberg | T. Kostiainen | Kirja: 7. luku | PostScript
|
| 31.3. | M. Syrjälahti | T. Koskela | Kirja: 12. luku | PostScript
|
| 7.4. | J. Kulju | J. Vesanto | Kirja: 3. luku | PostScript
|
| 7.4. | A. Vehtari | J. Hätönen | Sääntöjä MLP verkosta | PostScript
|
| 21.4. | J. Hätönen | M. Varsta | WEBSOM | PostScript
|
| 21.4. | J. Juujärvi | M. Syrjälahti | Datan projisoinnista |
|
Seminaarin tavoitteet:
- Seminaariaiheeseen perehtyminen
- Kirjallisen selostuksen laatiminen ja suullinen esitys
- Referee-toiminnan harjoittelu
Seminaarin suoritus:
- Materiaalin pohjalta laaditaan kirjallinen selostus, jonka
sopiva laajuus on noin 10 sivua. Selotukset laitetaan lopulta
kurssin www-sivuille, joko html muodossa tai PostScriptina.
- Selostus palautetaan ohjaajalle vähintään 1 viikko ennen
esitelmää.
Selostuksen voi lähettää e-mailitse: Jukka.Heikkonen@hut.fi
(postscript-tiedostona tai URL-osoitteena).
- Ohjaaja lähettää selostuksen arvioijalle, joka toimii myös
esitelmän opponenttina. Arvioija antaa korjausehdotukset,
jotka välitetään tekijälle ja opintojakson ohjaajalle.
Tekijä parantaa selostustaan annettujen korjausehdotusten
pohjalta ja palauttaa selostuksen 30.4.1998 mennessä
ohjaajalle.
- Esitelmän pito ja opponointi. Esitelmän sopiva kesto on n.
45 minuuttia.
- Kurssin hyväksytty suoritus edellyttää lisäksi riittävää
läsnäoloa (väh. 75%) seminaaritilaisuuksissa.
Arvosanaan vaikuttavat tekijät:
- Kirjallinen selostus: oleellisen asian tiivistys,
selkeys ja ymmärrettävyys. Aiheeseen liittyvän
lisämateriaalin kerääminen ja onnistunut hyödyntäminen
luonnollisesti tuo aina plussaa. Korjausehdotusten
huomioinen lopullisessa selostuksessa vaikuttaa myös
arvosteluun.
- Suullinen esitelmä: selkeys ja havainnollisuus, asian
opettaminen muille.
- Opponointi: korjausehdotusten rakentavuus, kysymysten
relevanssi.
Lisätietoja:
Jukka Heikkonen, TkT
Laskennallisen tekniikan laboratorio
Puh: 451 4829
email: Jukka.Heikkonen@hut.fi
Sivu päivitetty 16.4.1998 Jukka.Heikkonen@hut.fi
URL: http://www.lce.hut.fi/teaching/S-114.240/k98/