🤖AI
A Speech-Focused Multimodal LLM (GitHub Repo) 🔗
MMS-LLAMA-это эффективный мультимодальный речевой Framework для автоматического распознавания визуальной речи (AVSR), о
CSM speech model on MLX (GitHub Repo) 🔗
На прошлой неделе Sesame выпустил модель 1B для генерации разговорной речи.Этот репозиторий содержит нативную версию MLX Apple, которая может быстро работать на большинстве MacBook.
Hugging Face’s R1 replication (GitHub Repo) 🔗
Усилия Open-R1 предназначены для того, чтобы быть немного более надежными и полноценными, но все же минимальными и взломанными.Он делает больше шагов SFT и дистилляции данных.
State Space Models for 3D Object Detection (GitHub Repo) 🔗
Dest3D применяет интерактивную модель пространства состояний для обнаружения трехмерных объектов в точечных облаках, используя новые двунаправленные сканирующие и межгосударственные механизмы внимания для эффективного понимания сцены.
Tokenize an Image as a Set (GitHub Repo) 🔗
«Tokenize Image как набор»-это новая структура для генерации изображений, которая использует токенизацию на основе наборов и новый метод дискретной диффузии.Подход представляет изображения в виде неупорядоченных наборов токенов, что позволяет уникальный и мошенник генеративного моделирования.
Latent Multi-Hop Reasoning (GitHub Repo) 🔗
В этом исследовании изучается, выполняют ли крупные языковые модели (LLMS) рассуждения с несколькими ходами-процесс соединения нескольких фрагментов знаний-при представленных составных подсказках. Исследование обнаружило доказательства этого скрытого процесса рассуждения, особенно на начальном этапе, но использование связанных знаний варьировалось и показало тенденцию масштабирования с размером модели, что предполагает как проблемы, так и возможности для будущего развития LLM.
Efficient Remote Sensing Model (GitHub Repo) 🔗
DynamicVIS-это основополагающая модель для динамического визуального восприятия в дистанционном зондировании, которая предлагает эффективный анализ сверхуровных изображений с резко сниженными требованиями памяти и вычислений.
Roblox Foundation Model (GitHub Repo) 🔗
Roblox выпустила новую модель 3D -поколения и понимания, которую можно использовать для исследовательских приложений.
Stable virtual camera (GitHub Repo) 🔗
Stability AI выпустила отличную систему камер с несколькими видами, которая позволяет создать новый синтез представления.
Hybrid Vision-Language Model (GitHub Repo) 🔗
MATVLM-это гибридная модель на языке зрения, которая интегрирует слои MAMBA-2 в предварительно обученный VLM, улучшая скорость и производительность сходимости.
🎨Дизайн
Special HTML Symbols (Website) 🔗
Исследуйте и скопируйте различные HTML -символы, чтобы улучшить ваши проекты, улучшить читаемость и добавить в свои проекты уникальные символы.
Handcrafted Motion Components, Sections, and Templates (Website) 🔗
Motion-Primitives Pro предоставляет строительные блоки для быстрого создания восхитительных веб-сайтов, с последними модными компонентами и секциями, которые представляют собой непосильный труд при создании с нуля.
Real-Time Face and Voice Change (Website) 🔗
Бесплано меняет лица в высококачественных стримах, используя только одну фотографию.
All-In-One AI Design Platform (Website) 🔗
Создайте и отредактируйте в одном месте с помощью дизайнерского рабочего процесса.
All-in-One AI Image and Video Generator (Website) 🔗
Pollo AI-это окончательный генератор видео и изображений, все в одном, который позволяет легко создавать потрясающие видео и изображения с различных входов.
Match Colors from Any Image (Website) 🔗
Загрузите исходное фото и посмотрите Polarr Next AI Перенесите свой образ на ваше изображение.
💻Программирование
Adobe Analytics: Traffic to U.S. retail websites from Generative AI sources jumps 1,200 percent (5 minute read) 🔗
Генеративные интерфейсы в чате ИИ меняют то, как потребители действуют в Интернете.Adobe выпустила отчет, который показывает, как генеративные источники ИИ направляют значительный всплеск трафика на веб -сайты США.Генеративный ИИ был принят пользователями в качестве помощника по магазинам.Покупатели говорят, что интерфейсы чата с AI помогают сократить время, необходимое им, чтобы получить информацию, которая персонализируется в их потребностях.Технология заставляет предприятия переосмыслить взаимодействие с клиентами, особенно потому, что будущие агенты искусственного интеллекта смогут справиться с более сложными задачами и давать очень адаптированные рекомендации.
Fetcher MCP (GitHub Repo) 🔗
Fetcher MCP - это протокол контекста модели, который получает контент веб -страницы с использованием Playwright.
ttyd (GitHub Repo) 🔗
TTYD-это инструмент командной строки для обмена терминалом через Интернет.Он обеспечивает полнофункциональный терминал с поддержкой CJK и IME, поддержкой передачи файлов Zmodem/TRZSZ, поддержкой вывода изображения Sixel и многом другом.TTYD является кроссплатформенным и работает на MacOS, Linux, FreeBSD/OpenBSD, OpenWRT и Windows.Поддерживаются только последние версии Chrome, Edge, Firefox и Safari.
AI Blindspots (Website) 🔗
Список кодирования слепых пятен в моделях крупных языков (сосредоточен на семье Sonet).
Anubis (GitHub Repo) 🔗
Anubis-это инструмент, который проверяет соединения, используя задачу SHA256, чтобы защитить восходящие ресурсы от ботов скрапперов.
NVIDIA Dynamo (GitHub Repo) 🔗
NVIDIA Dynamo-это агностическая, высокопроизводительная, высокопроизводительная структура вывода с низкой задержкой, предназначенная для обслуживания генеративных моделей ИИ и рассуждений в распределенных средах с несколькими узлами.
🔐Кибербезопасность
Dojo-101 (GitHub Repo) 🔗
Dojo-101-это проект для захвата опыта и знаний в области кибербезопасности.
GitHub Actions Log Checker (GitHub Repo) 🔗
В связи с атаками TJ-Actions и ReviewDog цепочки поставок это действие сканирует журналы действий GitHub для разоблаченных секретов и учетных данных.
SentryPeer (GitHub Repo) 🔗
Sentrypeer - это инструмент для обнаружения мошенничества, который отслеживает попытки Bad Actors вызовы, сохраняя свои IP -адреса и набравшиеся номера.
New Vulnerability in GitHub Copilot and Cursor: How Hackers Can Weaponize Code Agents (5 minute read) 🔗
Исследователи из Pillar Security обнаружили новую технику быстрого впрыска на Cursor и GitHub Copilot.Эти системы используют файлы правил для руководства подсказкой для LLM, который часто распределяется по проектам с открытым исходным кодом или в других ненадежных местах.Эта атака включает в себя использование невидимых символов Unicode, чтобы скрыть вредоносные инструкции для LLM, которые можно использовать для того, чтобы поручить его отравлению сгенерированного кода.
StringReaper (GitHub Repo) 🔗
StringReaper извлекает строки, такие как токены JWT и учетные данные, из удаленной памяти процесса, сохранение времени в взаимодействиях.Он может отфильтровать области памяти и включать такие функции, как список целевых разделов, и отображение строк удаленной среды.
New Vulnerability in GitHub Copilot and Cursor: How Hackers Can Weaponize Code Agents (5 minute read) 🔗
Исследователи из Pillar Security обнаружили новую технику быстрого впрыска на Cursor и GitHub Copilot.Эти системы используют файлы правил для руководства подсказкой для LLM, который часто распределяется по проектам с открытым исходным кодом или в других ненадежных местах.Атака включает в себя использование невидимых символов Unicode, чтобы скрыть вредоносные инструкции для LLM, которые можно использовать для того, чтобы поручить его отравлению сгенерированного кода.
StringReaper (GitHub Repo) 🔗
StringReaper извлекает строки, такие как токены JWT и учетные данные, из удаленной памяти процесса, сохранение времени в взаимодействиях.Он может отфильтровать области памяти и включать такие функции, как список целевых разделов, и отображение строк удаленной среды.
Faction (GitHub Repo) 🔗
Фракция - это инструмент для создания и оценки отчета о тестировании PEN, который помогает автоматизировать отчеты о тестировании ручек и оценке безопасности.
🚀Новости науки и технологий
Обновление Horizon OS V76 🔗
🔗
Бета -версия Horizon OS V76 показывает, какие новые функции могут быть в Quest.
Самая компактная VR гарнитура в мире становится легче 🔗
🔗
Bogscreen Beyond 2 - самая компактная и легкая виртуальная гарнитура в мире. Преемник дополнительно уменьшает вес и улучшает линзы.
VR игра Mannequin имеет огромный приток новых игроков после перехода на F2P 🔗
🔗
Переход к модели бесплатной игры окупился. VR проект в прятки испытывает прилив новых игроков на Quest.
Varjo XR-4: Premium MR 🔗
🔗
Компания объявила, что некоторые расширенные функции смешанной реальности будут доступны только с платной годовой подпиской в размере 2500 долларов США за гарнитуру.
Snap Spectacles - поддержка GPS и другие новые функции 🔗
🔗
Snap Spectacles празднует свою шестимесячную годовщину. Чтобы отметить это событие, компания аннонсирует новые линзы.