OpenVK

OpenVK — творческое пространство и канал для коммуникаций, обмена опытом и общения с сообществом. Мы верим, что open source помогает сделать лучше технологии и весь мир.

Проекты OpenVK

VKUI
VKUI — библиотека React-компонентов, построенная на одноимённой дизайн-системе. С помощью VKUI можно создавать, как интерфейсы для мини-аппов, так и полноценные веб-приложения, которые наследуют визуальный язык VK.
ByteWeaver
ByteWeaver — инструмент для патчинга байт-кода Android-приложений во время сборки. Позволяет по определённым вами правилам автоматически добавлять логирование и другую сквозную аналитику. Также помогает в поиске ошибок и сбоев в коде или зависимостях.
StatsHouse
StatsHouse — высокодоступная масштабируемая мультитенантная система, программа для визуализации данных, которая используется для мониторинга и анализа работы IT-систем. StatsHouse предоставляет данные с высоким разрешением и низкой задержкой и долгосрочно хранит метрики.
Tarantool
Tarantool — middleware для работы с данными, которое ускоряет цифровые сервисы и снижает нагрузку на core-системы. Выдерживает до 1 000 000 RPS. Под капотом — распределённая in-memory СУБД с гибкой схемой данных, сервер приложений и средства масштабирования.
One-nio
One-nio — библиотека для создания высокопроизводительных приложений на языке Java. Помогает повысить эффективность работы приложений: оптимизированные нативные сокеты, offheap, сериализация, RPC, perf events, eBPF и многое другое.
DeviceHub
DeviceHub — система удаленного управления Android- и iOS-устройствами, которые используются для тестирования и разработки приложений. Она делает работу команд более эффективной: обеспечивает постоянную готовность устройств и гибкость настройки.

ML в OpenVK

Sentence Encoders — предобученные кодировщики используются для задач обработки естественного языка, таких как классификация и семантический поиск. Они преобразуют текст в численные представления, которые кодируют смысл текста. Это позволяет эффективно работать с перефразированием и синонимами — похожие по смыслу тексты будут близкими численно. На основе этих семантических представлений можно легко обучить мощные классификаторы для определения, например, токсичности или спама в тексте.

Source Code

EmoSpeech — неравномерное распределение эмоций в тексте играет ключевую роль в улучшении восприятия синтезированной речи и интонации. EmoSpeech включает механизм, который эффективно решает эту проблему, позволяя эмоциям по-разному влиять на каждый звук в речи. Модель используется для генерации эмоциональных оттенков при синтезе Text to Speech. Превосходит существующие как по MOS-оценке, так и по точности распознавания эмоций в синтезированной речи.

Source Code