Научиться парсить
Парсинг 15 сайтов различной тематики с выгрузкой данных в zip, exel и другие форматы, интеграция с телеграмм. Возможно размещение сервиса на круглосуточном терминале. Посмотреть несколько видеороликов на Youtube для знакомства с подходами и решениями.
Requests, BeautifulSoup, Scrapy, Lxml
Goal Accomplishment Criteria
Парсинг 15 сайтов различной тематики с выгрузкой данных в zip, exel и другие форматы.
Personal resources
Время
Goal ecological compatibility
Парсинг, одна из самых простых задач по работе с данными в веб среде. Выполнение этой цели позволит изучить популярные библиотеки и отточить навыки необходимые веб-разработчику.
-
https://health-diet.ru/table_calorie/
-
https://www.bundestag.de/
-
https://www.ozon.ru
-
https://emilydates.com/
-
https://www.recordpower.co.uk/
-
https://landingfolio.com/
-
https://www.avito.ru/
-
https://smartprogress.do
-
http://www.lib.ru/
-
https://panorama.pub/
-
https://www.defense.gov/
-
www.fl.ru/
-
freelancehunt.com
-
freelancejob.ru
-
habr
-
freelance.ru
-
kwork
-
weblancer
-
Телеграм
Вот библиотека с решением: номера и сообщения не парсит(
-
Реестр роскомсвободы
-
https://www.tradingview.com/
-
Нужно собрать данные по Владивостоку:
-
Сайт 8
Не обязательно парсить телеграмм канал, возможность выгрузки чата уже заложена в приложении
- 1745
- 27 August 2021, 06:53
Don't miss new posts!
Subscribe for the Goal and follow through to its completion