ТРЁХЭТАПНЫЙ ПОДХОД ОБРАБОТКИ ТЕКСТОВЫХ ДАННЫХ И ЕГО АЛГОРИТМЫ

Authors

  • Рахманов, Аскар Author
  • Абдувалиева, Зебинисо Author

DOI:

https://doi.org/10.5281/zenodo.17909167

Abstract

В данной статье рассматриваются основные методы обработки текстовых данных: лемматизация, токенизация и стемминг. Эти методы используются для нормализации и подготовки текста к анализу и машинному обучению. Описаны алгоритмы и подходы к реализации каждого метода, проанализированы их преимущества и недостатки. Результаты исследований приводят к выбору подходящего метода в зависимости от задачи и характеристик обрабатываемого текста

Downloads

Published

2025-12-12

How to Cite

Аскар, Р., & Зебинисо, А. (2025). ТРЁХЭТАПНЫЙ ПОДХОД ОБРАБОТКИ ТЕКСТОВЫХ ДАННЫХ И ЕГО АЛГОРИТМЫ. Eurasian Journal of Mathematical Theory and Computer Sciences, 5(12), 5-14. https://doi.org/10.5281/zenodo.17909167
Innovative Academy RSC
Article metrics Views and PDF downloads
0 Views
0 Downloads