Веб-скрейпинг с использованием ИИ с Jina, Google Sheets и OpenAI: простым способом

Без усилий преобразуйте данные с веб-сайта в организованные записи Google Sheets. Используйте Jina AI для веб-скрейпинга, превращая контент сайта в текст, готовый для обработки языковыми моделями. Извлекайте ключевую информацию о книгах — название, цену, доступность, URL изображения и URL продукта — с помощью технологий извлечения информации на базе ИИ. Автоматически делите и структурируйте данные на отдельные записи о книгах для удобного управления. Бесшовно интегрируйтесь с Google Sheets, мгновенно заполняя вашу таблицу свежими и полезными данными о книгах.

Category:

Описание

Этот рабочий процесс автоматизирует веб-скрепинг данных о книгах с указанного веб-сайта, структурирует извлеченную информацию и сохраняет её в таблице Google Sheets для удобного доступа и анализа. Он предназначен для ситуаций, когда пользователи хотят собирать и организовывать данные о продуктах (в данном примере — книгах) из онлайн-каталога без ручного копирования.

Рабочий процесс логически разделен на следующие блоки:

  • 1.1 Прием входных данных: Ручной триггер для запуска рабочего процесса.
  • 1.2 Веб-скрепинг: HTTP-запрос к сервису Jina AI, который извлекает целевую веб-страницу и возвращает текстовое представление, оптимизированное для языковых моделей.
  • 1.3 Извлечение информации с помощью ИИ: Использует узел извлекающего информацию LangChain с ИИ-моделью (Claude AI через интеграцию с OpenAI Chat Model), чтобы разобрать извлеченный текст и получить структурированные данные о книгах в соответствии со схемой JSON.
  • 1.4 Разделение данных: Разделяет извлеченный массив JSON на отдельные записи книг для дальнейшей обработки.
  • 1.5 Интеграция с Google Sheets: Добавляет каждую запись книги в виде новой строки в заранее определённую таблицу Google Sheets.

Оригинал воркфлоу на сайте n8n.io

👉🏻 Скачать на сайте n8n

____________

Отзывы

Отзывов пока нет.

Будьте первым, кто оставил отзыв на “Веб-скрейпинг с использованием ИИ с Jina, Google Sheets и OpenAI: простым способом”

Ваш адрес email не будет опубликован. Обязательные поля помечены *