НЕЙРОвести — AI агрегатор новостей

Странно, что про Firecrawl почти никто не пишет. Хотя это одна из самых полезных и крутых штук, если тебе нужно собирать данные с сайтов. Я про него знаю, вы скорее всего, тоже. Пусть будет в канале — чтобы было что кинуть в чат, когда кто-то спросит. | Firecrawl — это open-source фреймворк для веб-скрапинга. Ты даёшь ему ссылку — он обходит сайт и возвращает тебе чистые данные. Что умеет: • scrape — вытащить контент страницы в markdown, JSON, HTML или скриншотом • crawl — пройтись по всем ссылкам на странице и собрать их содержимое • map — просканировать сайт и выдать список всех URL • search — найти в интернете и вернуть содержимое найденных страниц • extract — достать структурированные данные с одной или тысячи страниц Что еще умеет: • сам борется с бот-защитами • умеет кликать, скроллить, ждать, логиниться • парсит PDF, DOCX, изображения • можно настроить: какие теги исключить, как глубоко лезть, какие заголовки передавать • теперь можно скормить сразу тысячи ссылок — он обработает их асинхронно Если строишь агента, работаешь с LLM или хочешь автоматизировать сбор данных с сайтов — посмотрись на Firecrawl. Сайт: firecrawl.dev GitHub: github.com/mendableai/firecrawl | У них еще недавно вышла новая штука — Firestarter. Платформа для сборки ботов на своих данных (см. видео) Можно скрапить сайт, натренировать бота и работать на своих источниках. Демо: tools.firecrawl.dev/firestarter GitHub: github.com/mendableai/firestarter #tools

NeuroVesti
Странно, что про Firecrawl почти никто не пишет. Хотя это одна из самых полезных и крутых штук, если тебе нужно собирать данные с сайтов. Я про него знаю, вы скорее всего, тоже. Пусть будет в канале — чтобы было что кинуть в чат, когда кто-то спросит. | Firecrawl — это open-source фреймворк для веб-скрапинга. Ты даёшь ему ссылку — он обходит сайт и возвращает тебе чистые данные. Что умеет: • scrape — вытащить контент страницы в markdown, JSON, HTML или скриншотом • crawl — пройтись по всем ссылкам на странице и собрать их содержимое • map — просканировать сайт и выдать список всех URL • search — найти в интернете и вернуть содержимое найденных страниц • extract — достать структурированные данные с одной или тысячи страниц Что еще умеет: • сам борется с бот-защитами • умеет кликать, скроллить, ждать, логиниться • парсит PDF, DOCX, изображения • можно настроить: какие теги исключить, как глубоко лезть, какие заголовки передавать • теперь можно скормить сразу тысячи ссылок — он обработает их асинхронно Если строишь агента, работаешь с LLM или хочешь автоматизировать сбор данных с сайтов — посмотрись на Firecrawl. Сайт: firecrawl.dev GitHub: github.com/mendableai/firecrawl | У них еще недавно вышла новая штука — Firestarter. Платформа для сборки ботов на своих данных (см. видео) Можно скрапить сайт, натренировать бота и работать на своих источниках. Демо: tools.firecrawl.dev/firestarter GitHub: github.com/mendableai/firestarter #tools
Странно, что про Firecrawl почти никто не пишет. Хотя это одна из самых полезных и крутых штук, если тебе нужно собирать данные с сайтов. Я про него знаю, вы скорее всего, тоже. Пусть будет в канале — чтобы было что кинуть в чат, когда кто-то спросит. | Firecrawl — это open-source фреймворк для веб-скрапинга. Ты даёшь ему ссылку — он обходит сайт и возвращает тебе чистые данные. Что умеет: • scrape — вытащить контент страницы в markdown, JSON, HTML или скриншотом • crawl — пройтись по всем ссылкам на странице и собрать их содержимое • map — просканировать сайт и выдать список всех URL • search — найти в интернете и вернуть содержимое найденных страниц • extract — достать структурированные данные с одной или тысячи страниц Что еще умеет: • сам борется с бот-защитами • умеет кликать, скроллить, ждать, логиниться • парсит PDF, DOCX, изображения • можно настроить: какие теги исключить, как глубоко лезть, какие заголовки передавать • теперь можно скормить сразу тысячи ссылок — он обработает их асинхронно Если строишь агента, работаешь с LLM или хочешь автоматизировать сбор данных с сайтов — посмотрись на Firecrawl. Сайт: firecrawl.dev GitHub: github.com/mendableai/firecrawl | У них еще недавно вышла новая штука — Firestarter. Платформа для сборки ботов на своих данных (см. видео) Можно скрапить сайт, натренировать бота и работать на своих источниках. Демо: tools.firecrawl.dev/firestarter GitHub: github.com/mendableai/firestarter #tools
Дата публикации: 02.07.2025 11:33