Microsoft открывает программное обеспечение, которое позволяет LLMS работать с электронными таблицами
Трубопровод электронной таблицы.Кредит: Arxiv (2024).Doi: 10.48550/arxiv.2407.09025
Команда программистов и специалистов по искусственному интеллекту в Microsoft разработала инструмент AI под названием Spreadsheetllm, который применяет большие возможности для моделей языка к электронным таблицам.В своем исследовании, в настоящее время размещенном на сервере Arxiv Preprint, группа разработала SheetCorsor, структура кодирования, которая эффективно сжимает электронные таблицы для использования крупными языковыми моделями (LLMS).
LLM, такие как CHATGPT, хорошо известны, но, поскольку все больше людей используют их, больше их пробелов становятся очевидными.Одним из пробелов является способность таких моделей осмыслить электронные таблицы.Из -за их уникальной договоренности и возможностей электронные таблицы остаются загадкой для LLMS, предотвращая их использование в качестве инструмента для бизнеса.
В этом новом исследовании команда Microsoft создала инструмент, который реорганизует электронную таблицу в форму, которую LLMS может использовать в качестве источника данных.И, как отмечает команда, она основана на концепции, которую они называют ShoteCressor, инструментом программирования, который позволяет управлять данными ИИ и анализ информации в электронных таблицах.
Для реализации Sheet -Compressor, исследователи разделили его на три основные функции: сжатие, перевод и агрегация формата данных.Первый был реализован путем добавления того, что команда описывает как якоря по всей электронной таблице, чтобы помочь LLM понять, что делает электронная таблица.
Оказавшись на месте, ряды и столбцы заменяются скелетированной таблицей.Затем модули трансляции используются для удаления пустых ячеек или повторяющихся значений.Применение перевода с перевернутым индексом в формате JSON обеспечивает агрегацию формата данных.
Команда также добавила другие модули для обработки уникальных ситуаций, таких как соседние ячейки с аналогичными численными форматами.Результатом является инструмент, который позволяет LLMS использовать электронные таблицы в качестве источника данных различными способами.
Исследовательская группа предполагает, что Spreadsheetllm открывает дверь для использования технологии LLM, чтобы революционизировать то, как используются таблицы таблиц;От автоматизации ввода данных до анализа данных до представления сложной информации таким образом, чтобы это было доступно для людей с различными опытами.И это, как они предлагают, будут создавать электронные таблицы и данные, которые они содержат гораздо более доступные и полезные.
More information: Yuzhang Tian et al, SpreadsheetLLM: Encoding Spreadsheets for Large Language Models, arXiv (2024). DOI: 10.48550/arxiv.2407.09025
© 2024 Science X Network
Нашли ошибку в тексте? Напишите нам.