Анализ новостного фона криптовалют
Ключевые слова:
криптовалюта, новость, классификация, прогнозирования, анализ, метрика, новостной фонАннотация
Данная статья посвящена анализу новостного фона для прогнозирования цен криптовалют с учетом эмоциональной окраски, связанных с ними новостей. Для этого был определен источник новостей, разработан алгоритм их получения и формирования базы для хранения извлеченной информации. Предложена методика обработки новостей, в результате чего появляется возможность классифицировать новости на категории с различной оценкой тональности текста. В результате разработано программное приложение для анализа новостного фона. С помощью данного приложения производится сбор новостей в автоматическом режиме из новостного источника, связанного с криптовалютными биржами, а затем с помощью выбранного классификатора выполняется автоматическая оценка новостей. Результаты исследований в дальнейшем могут быть использованы для разработки системы более точного прогнозирования цен криптовалют.
Библиографические ссылки
Андрианова, Е. Г., Новикова, О. А. Роль методов интеллектуального анализа текста в автоматизации прогнозирования рынка ценных бумаг [Электронный ресурс]. – Режим доступа: http://scyberleninka.ru/article/n/rol-metodov-intellektualnogo-analiza-teksta-v-avtomatizatsii-prognozirovaniya-rynka-tsennyh-bumag (дата обращения: 18.11.2022).
Gigi Sayfan. Современный веб-скрапинг с BeautifulSoup и Selenium. [Электронный ресурс]. - Режим доступа: https://code.tutsplus.com/ru/tutorials/modern-web-scraping-with-beautifulsoup-and-selenium--cms-30486 (дата обращения: 18.11.2022).
Частотный анализ русского текста и облако слов на Python. [Электронный ресурс].- Режим доступа: habr.com/ru/post/517410/ (дата обращения: 18.11.2022).
Метод Стохастического градиентного спуска [Электронный ресурс]. – Режим доступа: https://scikit-learn.ru/1-5-stochastic-gradient-descent/ (дата обращения: 18.01.2023).
Метод ближайших соседей в задачах классификации. [Электронный ресурс]. – Режим доступа: https://scikit-learn.ru/1-6-nearest-neighbors/ (дата обращения: 18.01.2023).
Метод опорных векторов [Электронный ресурс]. – Режим доступа: https://ww.tutorialspoint.com/scikit_learn/scikit_ learn_support_vector_machines.htm (дата обращения: 18.01.2023).
Использование CountVectorizer для извлечения объектов из текста. [Электронный ресурс]. – Режим доступа: https://www.geeksforgeeks.org/using-countvectorizer-to-extracting-features-from-text/ (дата обращения: 18.01.2023).
Извлечение функций с помощью TF-IDF. [Электронный ресурс]. – Режим доступа: https://www.geeksforgeeks.org/sklearn-feature-extraction-with-tf-idf/ (дата обращения: 18.01.2023).
Выбор функций для контролируемых моделей с использованием SelectKBest [Электронный ресурс]. – Режим доступа: https://runebook.dev/ru/docs/scikit_learn/modules/generated/sklearn.feature_selection.selectkbest (дата обращения: 18.01.2023).
Лабинцев, Е. Метрики в задачах машинного обучения [Электронный ресурс]. - Режим доступа: https://habr.com/ru/company/ ods/blog/328372/ (дата обращения: 18.01.2023)
Осовский, Н. Precision и recall. Как они соотносятся с порогом принятия решений? [Электронный ресурс]. - Режим доступа: https://habr.com/ru/post/661119/ (дата обращения: 18.01.2023).