Научиться парсить
Парсинг 15 сайтов различной тематики с выгрузкой данных в zip, exel и другие форматы, интеграция с телеграмм. Возможно размещение сервиса на круглосуточном терминале. Посмотреть несколько видеороликов на Youtube для знакомства с подходами и решениями.
Requests, BeautifulSoup, Scrapy, Lxml
Критерий завершения
Парсинг 15 сайтов различной тематики с выгрузкой данных в zip, exel и другие форматы.
Личные ресурсы
Время
Экологичность цели
Парсинг, одна из самых простых задач по работе с данными в веб среде. Выполнение этой цели позволит изучить популярные библиотеки и отточить навыки необходимые веб-разработчику.
-
https://health-diet.ru/table_calorie/
-
https://www.bundestag.de/
-
https://www.ozon.ru
-
https://emilydates.com/
-
https://www.recordpower.co.uk/
-
https://landingfolio.com/
-
https://www.avito.ru/
-
https://smartprogress.do
-
http://www.lib.ru/
-
https://panorama.pub/
-
https://www.defense.gov/
-
www.fl.ru/
-
freelancehunt.com
-
freelancejob.ru
-
habr
-
freelance.ru
-
kwork
-
weblancer
-
Телеграм
Вот библиотека с решением: номера и сообщения не парсит(
-
Реестр роскомсвободы
-
https://www.tradingview.com/
-
Нужно собрать данные по Владивостоку:
-
Сайт 8
Не обязательно парсить телеграмм канал, возможность выгрузки чата уже заложена в приложении
- 1738
- 27 августа 2021, 06:53
Не пропустите новые записи!
Подпишитесь на цель и следите за ее достижением