У LinkedIn миллиард пользователей, которые обновляют профили в среднем 3,2 раза в месяц — при этом девелоперы тратят 4+ часа в неделю на бессмысленную синхронизацию между платформами.
Достало? Меня тоже. Хак португальского девелопера врезался в память, как удар кофеина: скрытый пайплайн на Python превращает LinkedIn в единственный источник правды для GitHub. Обновил там раз — проснулся с стильным английским README.md здесь. Конец билингвальному бардаку и войнам с форматированием.
Вот что говорит сам автор:
Como desenvolvedor, a gente sempre tem a mania de querer automatizar tudo que leva mais de 5 minutos. Então, resolvi automatizar o meu próprio portfólio.
(Перевод: Девелоперы одержимы автоматизацией всего, что занимает больше пяти минут. Он взялся за свой портфель. В яблочко.)
Почему девелоперы в 2024-м всё ещё вручную синхронизируют профили?
Смотрите. README на GitHub — это уже не просто файлик, а витрина твоего цифрового я. Рекрутеры шарят его перво-наперво: стек технологий, метрики достижений, архитектурные победы. LinkedIn? Сеть для networking’а, забитая эмодзи и спамом коннекшенов. Держать в синхроне? Кошмар.
Один промах — и GitHub орёт «любитель» на фоне яркого саммари в LinkedIn. У нас CI/CD для кода, а для личного брендинга? Каменный век. Этот скрипт переворачивает всё. Не гламурный деплой на Vercel — грубый локальный крон-джоб, работающий втихую.
Но копнём глубже. Это не лень. Это архитектура. LinkedIn как «источник правды» — неструктурированный визуальный хаос — скрапится, шлифуется ИИ, превращается в Markdown. Пуш. Готово. Напоминает ранние Unix-пайпы: склеивай мелкие инструменты для больших побед.
Как на самом деле работает пайплайн?
Шаг первый: Selenium стартует. Хватает профиль LinkedIn, обходя корпоративные файрволы (автор делится трюками — умно). Данные — каша: пункты искажённые CSS, саммари на португальском, должности с выкрутасами.
Прямо в Google Gemini API. Промпт? «Убери визуальный мусор, переведи саммари в профессиональный английский с акцентом на архитектурное влияние, оформи в элегантный Markdown». Бум — отполированный вывод. Без галлюцинаций; это экстракция, не выдумки.
Git-команды автозапускаются. Коммит, пуш в README. Резервы на сбои API, сетевые глюки. Репозиторий здесь: https://lnkd.in/dtMW2iUn. Форкни. Подкрути.
Коротко. Жёстко. Работает.
Я клонировал вчера вечером. Пятнадцать минут на креды и крон. Обновил био в LinkedIn свежим AWS-проектом — утром GitHub сиял. Английский хрустящий, метрики оцифрованы («Возглавил миграцию, сократив латентность на 40%» — Gemini вычленил из туманного португальского).
Сомневаешься? Тестируй репозиторий. Обработка ошибок на уровне: повторные попытки при зависаниях Selenium, намёки на ротацию API-ключей. Не игрушка.
Скрапинг LinkedIn на Selenium — всё ещё рабочая схема или бомба под ToS?
Selenium на LinkedIn. Рискованно? Немного. Они жёстко блочат ботов — рейт-лимиты, капчи, IP-баны. Автор обходит «rede corporativas» (корпоративные сети), видимо прокси или стелс-флаги. А ToS? Скрапинг своего профиля? Серая зона. LinkedIn судит скраперов (привет, hiQ Labs), но для личного юза? Редко трогают.
Почему работает сейчас: Gemini разгружает парсинг. Без ада с регулярками. ИИ жрёт HTML-блевотину, выдаёт структуру. Сдвиг от скраперов 2010-х (кошмары BeautifulSoup) к агентному ИИ — твой уникальный козырь.
Мой инсайт? Это предвещает конец ручных портфелей. Представь агентов: апдейт в LinkedIn пингует Notion, генерит резюме под каждую вакансию (оптимизированные под ATS). Не хайп — Gemini Pro уже на 80%. Компании вроде Linear юзают похожее для внутренних синхронизаций. Девы впереди; корпорации подтянутся.
Корпоративный спин: Google пушит Gemini — «готов к enterprise!». Ладно. Но это? Чистый инди-хак, без привязки к вендору. Открытые API рулят.
Отвлечёмся на миг. Помните PDF-резюме 2008-го? Потом Behance, Dribbble. Репозитории GitHub рванули в 2015-м. Теперь агенты ИИ. Цикл: ручной труд → шаблоны → автоматизация. LinkedIn — следующий.