Kolmannen opetusperiodin viimeisellä Koodiklinikalla hahmotellaan askeleita kohti oppivien järjestelmien rakentamista.
Sisällön jalostaminen:
- Folksonomiat
- Natural Language Corpus Data: Beautiful Data (Norvig, 2008)
- TF-IDF
- fastText
- EmoPy
Koneoppiminen:
- luokittelu (classification)
- Kenen joukoissa seisot - ennustaako kone ehdokkaan puoluekannan? (Himberg)
- Diplomityö asiakasviestien automaattisesta luokittelusta (Hurme, 2017)
- ryhmittely (clustering)
- samankaltaisuusanalyysi (ks. Document Similarity using NLTK and Scikit-Learn )
Suosittelujärjestelmät:
- Quick Guide to Build a Recommendation Engine in Python (Jain 2016)
- Recommender systems, Part 1: Introduction to approaches and algorithms (M. Jones, IBM)
- Surprise: A Python scikit for recommender systems
Johdanto datatieteeseen käy läpi koneoppimisen mentelmiä, jotka soveltuvat myös oppivien ja “älykkäiden” järjestelmien kehittämiseen.
