Парсинг – это автоматизированный процесс, при котором осуществляется сбор контента или данных с определенного сервиса или сайта.
Контентом является html-код страниц сайтов. Результат складывается в виде базы данных.
Поисковые роботы являются примером парсеров, которые занимаются анализом страниц, полученные данные сохраняют у себя в базе, а затем при поиске показывают актуальные документы.
Парсинг используется очень часто в области поисковой оптимизации.
Существуют три фазы парсинга:
1. Получение контента в исходном виде.
2. Извлечение и преобразование данных.
3. Генерация результата.