Analysis of the news background of cryptocurrencies
Keywords:
cryptocurrency, news, classification, forecasting, analysis, metric, news backgroundAbstract
This article is devoted to the analysis of the news background for predicting the prices of cryptocurrencies, taking into account the emotional coloring of the news related to them. To do this, a news source was identified, an algorithm for obtaining them and forming a database for storing the extracted information was developed. A method of news processing is proposed, as a result of which it becomes possible to classify news into categories with a different assessment of the tonality of the text. As a result, a software application has been developed to analyze the news background. With the help of this application, news is collected automatically from a news source associated with cryptocurrency exchanges, and then an automatic news assessment is performed using the selected classifier. The research results can be used in the future to develop a system for more accurate prediction of cryptocurrency prices.
References
Андрианова, Е. Г., Новикова, О. А. Роль методов интеллектуального анализа текста в автоматизации прогнозирования рынка ценных бумаг [Электронный ресурс]. – Режим доступа: http://scyberleninka.ru/article/n/rol-metodov-intellektualnogo-analiza-teksta-v-avtomatizatsii-prognozirovaniya-rynka-tsennyh-bumag (дата обращения: 18.11.2022).
Gigi Sayfan. Современный веб-скрапинг с BeautifulSoup и Selenium. [Электронный ресурс]. - Режим доступа: https://code.tutsplus.com/ru/tutorials/modern-web-scraping-with-beautifulsoup-and-selenium--cms-30486 (дата обращения: 18.11.2022).
Частотный анализ русского текста и облако слов на Python. [Электронный ресурс].- Режим доступа: habr.com/ru/post/517410/ (дата обращения: 18.11.2022).
Метод Стохастического градиентного спуска [Электронный ресурс]. – Режим доступа: https://scikit-learn.ru/1-5-stochastic-gradient-descent/ (дата обращения: 18.01.2023).
Метод ближайших соседей в задачах классификации. [Электронный ресурс]. – Режим доступа: https://scikit-learn.ru/1-6-nearest-neighbors/ (дата обращения: 18.01.2023).
Метод опорных векторов [Электронный ресурс]. – Режим доступа: https://ww.tutorialspoint.com/scikit_learn/scikit_ learn_support_vector_machines.htm (дата обращения: 18.01.2023).
Использование CountVectorizer для извлечения объектов из текста. [Электронный ресурс]. – Режим доступа: https://www.geeksforgeeks.org/using-countvectorizer-to-extracting-features-from-text/ (дата обращения: 18.01.2023).
Извлечение функций с помощью TF-IDF. [Электронный ресурс]. – Режим доступа: https://www.geeksforgeeks.org/sklearn-feature-extraction-with-tf-idf/ (дата обращения: 18.01.2023).
Выбор функций для контролируемых моделей с использованием SelectKBest [Электронный ресурс]. – Режим доступа: https://runebook.dev/ru/docs/scikit_learn/modules/generated/sklearn.feature_selection.selectkbest (дата обращения: 18.01.2023).
Лабинцев, Е. Метрики в задачах машинного обучения [Электронный ресурс]. - Режим доступа: https://habr.com/ru/company/ ods/blog/328372/ (дата обращения: 18.01.2023)
Осовский, Н. Precision и recall. Как они соотносятся с порогом принятия решений? [Электронный ресурс]. - Режим доступа: https://habr.com/ru/post/661119/ (дата обращения: 18.01.2023).