2 мин. чтения
7/17/2024 11:20:01 AM

Microsoft открывает программное обеспечение, которое позволяет LLMS работать с электронными таблицами

Article Preview Image Трубопровод электронной таблицы.Кредит: Arxiv (2024).Doi: 10.48550/arxiv.2407.09025

Команда программистов и специалистов по искусственному интеллекту в Microsoft разработала инструмент AI под названием Spreadsheetllm, который применяет большие возможности для моделей языка к электронным таблицам.В своем исследовании, в настоящее время размещенном на сервере Arxiv Preprint, группа разработала SheetCorsor, структура кодирования, которая эффективно сжимает электронные таблицы для использования крупными языковыми моделями (LLMS).

LLM, такие как CHATGPT, хорошо известны, но, поскольку все больше людей используют их, больше их пробелов становятся очевидными.Одним из пробелов является способность таких моделей осмыслить электронные таблицы.Из -за их уникальной договоренности и возможностей электронные таблицы остаются загадкой для LLMS, предотвращая их использование в качестве инструмента для бизнеса.

В этом новом исследовании команда Microsoft создала инструмент, который реорганизует электронную таблицу в форму, которую LLMS может использовать в качестве источника данных.И, как отмечает команда, она основана на концепции, которую они называют ShoteCressor, инструментом программирования, который позволяет управлять данными ИИ и анализ информации в электронных таблицах.

Для реализации Sheet -Compressor, исследователи разделили его на три основные функции: сжатие, перевод и агрегация формата данных.Первый был реализован путем добавления того, что команда описывает как якоря по всей электронной таблице, чтобы помочь LLM понять, что делает электронная таблица.

Оказавшись на месте, ряды и столбцы заменяются скелетированной таблицей.Затем модули трансляции используются для удаления пустых ячеек или повторяющихся значений.Применение перевода с перевернутым индексом в формате JSON обеспечивает агрегацию формата данных.

Команда также добавила другие модули для обработки уникальных ситуаций, таких как соседние ячейки с аналогичными численными форматами.Результатом является инструмент, который позволяет LLMS использовать электронные таблицы в качестве источника данных различными способами.

Исследовательская группа предполагает, что Spreadsheetllm открывает дверь для использования технологии LLM, чтобы революционизировать то, как используются таблицы таблиц;От автоматизации ввода данных до анализа данных до представления сложной информации таким образом, чтобы это было доступно для людей с различными опытами.И это, как они предлагают, будут создавать электронные таблицы и данные, которые они содержат гораздо более доступные и полезные.

More information: Yuzhang Tian et al, SpreadsheetLLM: Encoding Spreadsheets for Large Language Models, arXiv (2024). DOI: 10.48550/arxiv.2407.09025

© 2024 Science X Network

Получи бесплатную еженедельную рассылку со ссылками на репозитории и лонгриды самых интересных историй о стартапах 🚀, AI технологиях 👩‍💻 и программировании 💻!
Присоединяйся к тысячам читателей для получения одного еженедельного письма

Подписывайся на нас:

Нашли ошибку в тексте? Напишите нам.

Добавляй ЛРНЧ в свою ленту Google Новостей.
Читайте далее 📖

Ускорение локализации неисправности во время разработки программного обеспечения

8/1/2024 · 2 мин. чтения

Ускорение локализации неисправности во время разработки программного обеспечения

Интерактивная многоуправляемая карта полусферы: унифицированный подход к точке GNSS

7/31/2024 · 2 мин. чтения

Интерактивная многоуправляемая карта полусферы: унифицированный подход к точке GNSS

*Facebook, Instagram, Meta - запрещенные в РФ организации.