Witsy — Desktop AI Assistant
Witsy — это десктопное приложение для работы с языковыми моделями по принципу BYOK (Bring Your Own Keys). Вы подключаете собственные API-ключи от провайдеров LLM (OpenAI, Anthropic, Google, Mistral и др.) или используете локальные модели через Ollama. Приложение доступно для скачивания на witsyai.com или в релизах на GitHub.
Возможности
- Поддержка моделей OpenAI, Ollama, Anthropic, MistralAI, Google, xAI, OpenRouter, DeepSeek, Groq, Cerebras и других (через OpenAI-совместимый слой: Together, SiliconFlow, Fireworks и т.п.).
- Чат с поддержкой vision (описание изображений).
- Генерация изображений и видео (OpenAI, Google, xAI, Replicate, fal.ai, HuggingFace).
- Редактирование изображений и генерация видео из изображений (Google, Replicate, fal.ai).
- Scratchpad — интерактивная область для создания контента с помощью любой модели.
- Prompt Anywhere — вызов окна запроса из любого приложения горячей клавишей (Shift+Control+Space). На Mac можно автоматически выбирать эксперта в зависимости от активного приложения (например, для терминала — эксперт по Linux-командам).
- AI Commands — быстрые команды по выделенному тексту в любом приложении (Alt+Control+Space). Можно создавать собственные команды.
- Experts — специализированные промпты для разных задач (на основе awesome-chatgpt-prompts).
- LLM-плагины: выполнение Python-кода, поиск в интернете, долговременная память и другие.
- Озвучивание ответов ассистента и любого текста в других приложениях (требуется API-ключ OpenAI или ElevenLabs).
- Чат с локальными файлами (RAG): добавьте документы в репозиторий — Witsy найдёт релевантные фрагменты и передаст их в LLM.
- Транскрибация и диктовка (Speech-to-Text) через OpenAI Whisper (online/локальный).
- Realtime-чат (Voice Mode).
- Поддержка Anthropic Computer Use.
- Локальная история диалогов с автоназваниями.
- Форматирование и копирование в буфер кода.
- Экспорт диалога в PDF.
- Копирование и скачивание изображений.
Установка и запуск
- Скачайте готовую сборку с witsyai.com или из релизов.
- Либо соберите сами:
npm install
npm start
Настройка провайдеров
Для работы с платными моделями введите API-ключи в настройках:
Для Ollama: установите Ollama и загрузите модели (библиотека моделей).
Для озвучивания: нужен API-ключ OpenAI (или ElevenLabs).
Для поиска в интернете: ключ Tavily.
Примеры использования
Чат с RAG
- В чате нажмите иконку базы данных слева от поля ввода.
- Создайте репозиторий документов (для OpenAI Embedding нужен ключ, для Ollama — модель эмбеддингов).
- Добавьте файлы кнопкой «+».
- Выберите созданный репозиторий — иконка станет синей.
Транскрибация
Запишите аудио с микрофона — будет распознано через OpenAI Whisper (online/локальный). Результат можно скопировать в буфер или вставить в предыдущее активное приложение.
AI Commands
Выделите текст в любом приложении, нажмите Alt+Control+Space и выберите команду. Можно создать собственную команду с произвольным промптом.
Важно
- Приложение использует собственные ключи — будьте внимательны с их хранением.
- Для работы некоторых функций (например, интернет-поиск) требуются дополнительные API-ключи.
- Локальная Whisper-модель для диктовки требует загрузки больших файлов.
Планы и проделанная работа
В разработке: полноценное хранение в SQLite3.
Уже реализовано: быстрые кнопки, fal.ai, отладка, Design Studio, i18n, рендеринг диаграмм Mermaid, Model Context Protocol, локальный веб-поиск, модель по умолчанию, выбор языка Speech-to-Text, настройки параметров модели, избранные модели, ElevenLabs TTS, кастомные движки (OpenAI-совместимые), долговременная память, OpenRouter, DeepSeek, folder mode, настройка инструкций, форк чата, realtime-чат, Replicate video, Together.ai, Gemini 2.0 Flash, Groq LLama 3.3, xAI Grok Vision, Ollama function-calling, Replicate image, AI Commands redesign, отчёт об использовании токенов, модели o1, Groq vision, изменение размера изображений, Llama 3.2 vision, YouTube-плагин, RAG в Scratchpad, Hugging Face image generation, Anthropic Computer Use, автообновление, тёмная тема, conversation mode, Google/Anthropic function calling, Scratchpad, диктовка (Whisper + WebGPU), авто-выбор эксперта на Mac, Cerebras, RAG по локальным файлам, PDF-экспорт, редактируемые Experts, read aloud, импорт/экспорт команд, Ollama base URL, OpenAI base URL, DALL-E как инструмент, Google Gemini API, Prompt Anywhere, отмена команд, GPT-4o, разные модели по умолчанию для команд, текстовые вложения (TXT, PDF, DOCX, PPTX, XLSX), MistralAI function calling, автообновление, группировка истории по датам, Groq API, кастомные промпты, sandbox & contextIsolation, меню приложения, навигация по истории, Ollama model pull, macOS notarization, AI commands, Tavily internet search, Python executor, Latex rendering, сохранять/восстанавливать позицию окна и многое другое.
Witsy — проект с открытым исходным кодом. Вы можете поддержать автора на GitHub Sponsors.
Комментарии
Комментариев пока нет. Будьте первым.