ЛРНЧ 3/25/2025
7 мин. чтения

🤖AI

A Speech-Focused Multimodal LLM (GitHub Repo) 🔗

MMS-LLAMA-это эффективный мультимодальный речевой Framework для автоматического распознавания визуальной речи (AVSR), о

CSM speech model on MLX (GitHub Repo) 🔗

На прошлой неделе Sesame выпустил модель 1B для генерации разговорной речи.Этот репозиторий содержит нативную версию MLX Apple, которая может быстро работать на большинстве MacBook.

Hugging Face’s R1 replication (GitHub Repo) 🔗

Усилия Open-R1 предназначены для того, чтобы быть немного более надежными и полноценными, но все же минимальными и взломанными.Он делает больше шагов SFT и дистилляции данных.

State Space Models for 3D Object Detection (GitHub Repo) 🔗

Dest3D применяет интерактивную модель пространства состояний для обнаружения трехмерных объектов в точечных облаках, используя новые двунаправленные сканирующие и межгосударственные механизмы внимания для эффективного понимания сцены.

Tokenize an Image as a Set (GitHub Repo) 🔗

«Tokenize Image как набор»-это новая структура для генерации изображений, которая использует токенизацию на основе наборов и новый метод дискретной диффузии.Подход представляет изображения в виде неупорядоченных наборов токенов, что позволяет уникальный и мошенник генеративного моделирования.

Latent Multi-Hop Reasoning (GitHub Repo) 🔗

В этом исследовании изучается, выполняют ли крупные языковые модели (LLMS) рассуждения с несколькими ходами-процесс соединения нескольких фрагментов знаний-при представленных составных подсказках. Исследование обнаружило доказательства этого скрытого процесса рассуждения, особенно на начальном этапе, но использование связанных знаний варьировалось и показало тенденцию масштабирования с размером модели, что предполагает как проблемы, так и возможности для будущего развития LLM.

Efficient Remote Sensing Model (GitHub Repo) 🔗

DynamicVIS-это основополагающая модель для динамического визуального восприятия в дистанционном зондировании, которая предлагает эффективный анализ сверхуровных изображений с резко сниженными требованиями памяти и вычислений.

Roblox Foundation Model (GitHub Repo) 🔗

Roblox выпустила новую модель 3D -поколения и понимания, которую можно использовать для исследовательских приложений.

Stable virtual camera (GitHub Repo) 🔗

Stability AI выпустила отличную систему камер с несколькими видами, которая позволяет создать новый синтез представления.

Hybrid Vision-Language Model (GitHub Repo) 🔗

MATVLM-это гибридная модель на языке зрения, которая интегрирует слои MAMBA-2 в предварительно обученный VLM, улучшая скорость и производительность сходимости.

🎨Дизайн

Special HTML Symbols (Website) 🔗

Исследуйте и скопируйте различные HTML -символы, чтобы улучшить ваши проекты, улучшить читаемость и добавить в свои проекты уникальные символы.

Handcrafted Motion Components, Sections, and Templates (Website) 🔗

Motion-Primitives Pro предоставляет строительные блоки для быстрого создания восхитительных веб-сайтов, с последними модными компонентами и секциями, которые представляют собой непосильный труд при создании с нуля.

Real-Time Face and Voice Change (Website) 🔗

Бесплано меняет лица в высококачественных стримах, используя только одну фотографию.

All-In-One AI Design Platform (Website) 🔗

Создайте и отредактируйте в одном месте с помощью дизайнерского рабочего процесса.

All-in-One AI Image and Video Generator (Website) 🔗

Pollo AI-это окончательный генератор видео и изображений, все в одном, который позволяет легко создавать потрясающие видео и изображения с различных входов.

Match Colors from Any Image (Website) 🔗

Загрузите исходное фото и посмотрите Polarr Next AI Перенесите свой образ на ваше изображение.

💻Программирование

Adobe Analytics: Traffic to U.S. retail websites from Generative AI sources jumps 1,200 percent (5 minute read) 🔗

Генеративные интерфейсы в чате ИИ меняют то, как потребители действуют в Интернете.Adobe выпустила отчет, который показывает, как генеративные источники ИИ направляют значительный всплеск трафика на веб -сайты США.Генеративный ИИ был принят пользователями в качестве помощника по магазинам.Покупатели говорят, что интерфейсы чата с AI помогают сократить время, необходимое им, чтобы получить информацию, которая персонализируется в их потребностях.Технология заставляет предприятия переосмыслить взаимодействие с клиентами, особенно потому, что будущие агенты искусственного интеллекта смогут справиться с более сложными задачами и давать очень адаптированные рекомендации.

Fetcher MCP (GitHub Repo) 🔗

Fetcher MCP - это протокол контекста модели, который получает контент веб -страницы с использованием Playwright.

ttyd (GitHub Repo) 🔗

TTYD-это инструмент командной строки для обмена терминалом через Интернет.Он обеспечивает полнофункциональный терминал с поддержкой CJK и IME, поддержкой передачи файлов Zmodem/TRZSZ, поддержкой вывода изображения Sixel и многом другом.TTYD является кроссплатформенным и работает на MacOS, Linux, FreeBSD/OpenBSD, OpenWRT и Windows.Поддерживаются только последние версии Chrome, Edge, Firefox и Safari.

AI Blindspots (Website) 🔗

Список кодирования слепых пятен в моделях крупных языков (сосредоточен на семье Sonet).

Anubis (GitHub Repo) 🔗

Anubis-это инструмент, который проверяет соединения, используя задачу SHA256, чтобы защитить восходящие ресурсы от ботов скрапперов.

NVIDIA Dynamo (GitHub Repo) 🔗

NVIDIA Dynamo-это агностическая, высокопроизводительная, высокопроизводительная структура вывода с низкой задержкой, предназначенная для обслуживания генеративных моделей ИИ и рассуждений в распределенных средах с несколькими узлами.

🔐Кибербезопасность

Dojo-101 (GitHub Repo) 🔗

Dojo-101-это проект для захвата опыта и знаний в области кибербезопасности.

GitHub Actions Log Checker (GitHub Repo) 🔗

В связи с атаками TJ-Actions и ReviewDog цепочки поставок это действие сканирует журналы действий GitHub для разоблаченных секретов и учетных данных.

SentryPeer (GitHub Repo) 🔗

Sentrypeer - это инструмент для обнаружения мошенничества, который отслеживает попытки Bad Actors вызовы, сохраняя свои IP -адреса и набравшиеся номера.

New Vulnerability in GitHub Copilot and Cursor: How Hackers Can Weaponize Code Agents (5 minute read) 🔗

Исследователи из Pillar Security обнаружили новую технику быстрого впрыска на Cursor и GitHub Copilot.Эти системы используют файлы правил для руководства подсказкой для LLM, который часто распределяется по проектам с открытым исходным кодом или в других ненадежных местах.Эта атака включает в себя использование невидимых символов Unicode, чтобы скрыть вредоносные инструкции для LLM, которые можно использовать для того, чтобы поручить его отравлению сгенерированного кода.

StringReaper (GitHub Repo) 🔗

StringReaper извлекает строки, такие как токены JWT и учетные данные, из удаленной памяти процесса, сохранение времени в взаимодействиях.Он может отфильтровать области памяти и включать такие функции, как список целевых разделов, и отображение строк удаленной среды.

New Vulnerability in GitHub Copilot and Cursor: How Hackers Can Weaponize Code Agents (5 minute read) 🔗

Исследователи из Pillar Security обнаружили новую технику быстрого впрыска на Cursor и GitHub Copilot.Эти системы используют файлы правил для руководства подсказкой для LLM, который часто распределяется по проектам с открытым исходным кодом или в других ненадежных местах.Атака включает в себя использование невидимых символов Unicode, чтобы скрыть вредоносные инструкции для LLM, которые можно использовать для того, чтобы поручить его отравлению сгенерированного кода.

StringReaper (GitHub Repo) 🔗

StringReaper извлекает строки, такие как токены JWT и учетные данные, из удаленной памяти процесса, сохранение времени в взаимодействиях.Он может отфильтровать области памяти и включать такие функции, как список целевых разделов, и отображение строк удаленной среды.

Faction (GitHub Repo) 🔗

Фракция - это инструмент для создания и оценки отчета о тестировании PEN, который помогает автоматизировать отчеты о тестировании ручек и оценке безопасности.

🚀Новости науки и технологий

Обновление Horizon OS V76 🔗

Image for news 🔗 Бета -версия Horizon OS V76 показывает, какие новые функции могут быть в Quest.

Самая компактная VR гарнитура в мире становится легче 🔗

Image for news 🔗 Bogscreen Beyond 2 - самая компактная и легкая виртуальная гарнитура в мире. Преемник дополнительно уменьшает вес и улучшает линзы.

VR игра Mannequin имеет огромный приток новых игроков после перехода на F2P 🔗

Image for news 🔗 Переход к модели бесплатной игры окупился. VR проект в прятки испытывает прилив новых игроков на Quest.

Varjo XR-4: Premium MR 🔗

Image for news 🔗 Компания объявила, что некоторые расширенные функции смешанной реальности будут доступны только с платной годовой подпиской в ​​размере 2500 долларов США за гарнитуру.

Snap Spectacles - поддержка GPS и другие новые функции 🔗

Image for news 🔗 Snap Spectacles празднует свою шестимесячную годовщину. Чтобы отметить это событие, компания аннонсирует новые линзы.


Получи бесплатную еженедельную рассылку со ссылками на репозитории и лонгриды самых интересных историй о стартапах 🚀, AI технологиях 👩‍💻 и программировании 💻!
Присоединяйся к тысячам читателей для получения одного еженедельного письма

*Facebook, Instagram, Meta - запрещенные в РФ организации.