Название скрыто (Гемблинг)

Python-разработчик в отдел ML

в Название скрыто (Гемблинг)

от 200 000 ₽/‍мес на руки

📍 Москва
Гибрид
📍 Россия
Удалённо
Специализация
Python
Уровень
Middle
Требуемый опыт
2+ лет

Технологии/инструменты

Python
asyncio
PyQt/wxPython/Tkinter/Kivy
FastAPI
Airflow
CI/CD
Docker
Docker Compose
Selenium
Beautiful Soup 4
Scrapy
CAPTCHA
SQL
PostgreSQL
ORM
SQLAlchemy
fuzzywuzzy

Задачи

  • Дорабатывать существующие проекты парсинга, создавать новые парсеры для различных источников, включая конкурентов.
  • Организовывать хранение данных парсинга и работа с ETL-процессами.
  • Агрегировать и обрабатывать данные.

Требования

  • Умение работать с технологиями парсинга сайтов для автоматизации сбора данных.
  • Знание Python, коммерческий опыт от 2 лет (в идеале Python Asyncio).
  • Опыт разработки парсеров для высоконагруженных проектов, обход блокировок по IP, прочих блокировок от парсинга.
  • Многопоточный парсинг данных.
  • Владение любым пакетом для создания интерфейсов (например, PyQt, wxPython, Tkinter, Kivy и т. п.).
  • Веб-фреймворки (FastAPI), Airflow, CI/CD (Docker, Docker Compose).
  • Парсинг (Selenium, Beautiful Soup 4, Scrapy), опыт обхода блокировок по IP/капчи.
  • БД (SQL, PostgreSQL) — индексы, транзакции, понимание/опыт оптимизации сложных запросов, будет плюсом опыт использования различных ORM (SQLAlchemy и др.).
  • Знание и понимание алгоритмов сопоставления текстовых данных (fuzzywuzzy).
Название скрыто (Гемблинг)

О компании Название скрыто (Гемблинг)

Название скрыто под NDA. Международный проект в сфере iGaming. Проект быстро развивается, осваивает новые рынки и набирает классных специалистов, которые помогут в запуске и развитии новых стран. Без «высокотехнологичной» и «поддержки спорта» и т.д. Все подробности рекрутер раскроет лично сразу после отклика.