Viimeisellä Koodiklinikalla hahmotellaan askeleita kohti oppivien järjestelmien rakentamista.
Sisällön jalostaminen
- Folksonomiat
- Natural Language Corpus Data: Beautiful Data (Norvig, 2008)
- TF-IDF
- Aihepiirianalyysi, ks. Aihepiirianalyysi kansanedustajien puheista (Parkkinen, 2012)
Koneoppiminen
- luokittelu (classification), esimerkiksi sentimenttianalyysi (Predicting sentiment from product reviews, 01/03) ja
- Kenen joukoissa seisot - ennustaako kone ehdokkaan puoluekannan? (Himberg)
- Diplomityö asiakasviestien automaattisesta luokittelusta (Hurme, 2017)
- ryhmittely (clustering)
- samankaltaisuusanalyysi (ks. Document Similarity using NLTK and Scikit-Learn )
- Ks. Machine Learning Specialization (huomaathan: kokonaisuuden kehitys keskeytetty) ja SGN-41007 Pattern Recognition and Machine Learning
SuosittelujärjestelmätLisätietoa:
- Overview of Recommender Systems (Stanford University)
- Recommender systems, Part 1: Introduction to approaches and algorithms (M. Jones, IBM)
- Surprise: A Python scikit for recommender systems
- Collaborative Filtering with Python (Marafi, 2015)