Модел на данните

За обучение на модела на данните е използван файлът с всички пречистени туитове тук  14MB в JSON формат и тук 13MB като CSV. Моделът може да се изтегли от тук  60MB като .model файл. Архив със скриптове за трениране, проверка на сходство и визуализация с Bokeh и matplotlib може да се изтегли от тук  52MB.