За обучение на модела на данните е използван файлът с всички пречистени туитове тук 14MB в JSON формат и тук 13MB като CSV.
Моделът може да се изтегли от тук 60MB като .model файл.
Архив със скриптове за трениране, проверка на сходство и визуализация с Bokeh и matplotlib може да се изтегли от тук 52MB.