Higress — AI-нативный API-шлюз
Higress — это облачный API-шлюз, построенный на основе Istio и Envoy. Он поддерживает расширение с помощью Wasm-плагинов на языках Go, Rust и JavaScript. Проект создан в Alibaba для решения проблем Tengine (долгая перезагрузка, недостаточная балансировка для gRPC/Dubbo) и прошёл более двух лет промышленной эксплуатации. В настоящее время Higress используется в Alibaba Cloud как основа для облачного продукта API-шлюза, обеспечивая 99,99% доступности для тысяч корпоративных клиентов.
Higress особенно силён как AI-шлюз: он поддерживает все основные модели (как китайские, так и зарубежные) через провайдеров, а также self-hosted модели DeepSeek на vllm/ollama. Внутри Alibaba обслуживает AI-сервисы Tongyi Qianwen APP, Bailian и PAI. Также используется ведущими AIGC-компаниями (например, Zero One Infinite) и продуктами (FastGPT).
Быстрый старт
Higress можно запустить одной командой Docker, что удобно для локальной разработки или небольших проектов:
# Создаём рабочую директорию
mkdir higress && cd higress
# Запускаем Higress (конфигурация сохранится в текущей папке)
docker run -d --rm --name higress-ai -v ${PWD}:/data \
-p 8001:8001 -p 8080:8080 -p 8443:8443 \
higress-registry.cn-hangzhou.cr.aliyuncs.com/higress/all-in-one:latest
Порты:
8001 — UI-консоль Higress
8080 — HTTP-вход шлюза
8443 — HTTPS-вход шлюза
Образы Higress хранятся в собственном реестре (без ограничений Docker Hub) и проходят проверку безопасности (Alibaba Cloud ACR). Для установки в Kubernetes (Helm) и других способов см. официальную документацию.
Варианты использования
AI-шлюз
Higress подключается ко всем LLM-провайдерам через единый протокол и предоставляет:
- единую observability для AI
- балансировку нагрузки и fallback между разными моделями
- AI-токен rate limiting
- AI-кэширование
Все популярные провайдеры (OpenAI, Claude, DeepSeek, Tongyi и др.) поддерживаются «из коробки» — список можно найти в репозитории плагинов.
Хостинг MCP-серверов
Higress умеет хостить MCP-серверы (Model Context Protocol) через механизм плагинов. MCP — это AI-friendly API, позволяющий AI-агентам вызывать инструменты и сервисы. Higress предоставляет единые механизмы аутентификации, авторизации, rate limiting и observability для таких вызовов.
Преимущества хостинга MCP на Higress:
- единая аутентификация и авторизация для всех вызовов AI-агентов
- тонкий rate limiting для предотвращения злоупотреблений
- полные audit-логи всех вызовов инструментов
- observability: мониторинг производительности и здоровья вызовов
- динамическое обновление без потери соединений (благодаря Envoy и Wasm-плагинам)
Подробнее: MCP QuickStart
Ingress-контроллер для Kubernetes
Higress может выступать в роли полнофункционального ingress-контроллера, совместимого со многими аннотациями nginx ingress. Скоро будет поддержка Gateway API (sigs.k8s.io/gateway-api) с плавной миграцией с Ingress API.
Микросервисный шлюз
Higress умеет обнаруживать микросервисы из различных реестров: Nacos, ZooKeeper, Consul, Eureka. Глубокая интеграция с Dubbo, Nacos, Sentinel и другими компонентами микросервисного стека Alibaba.
Security-шлюз
Встроенная поддержка WAF и различных стратегий аутентификации: key-auth, hmac-auth, jwt-auth, basic-auth, OIDC и др.
Ключевые преимущества
- Промышленная зрелость: более 2 лет внутри Alibaba, сотни тысяч запросов в секунду.
- Нулевые перезагрузки: конфигурация применяется за миллисекунды без дёргания соединений — идеально для AI-сервисов с долгими соединениями.
- Полная потоковая обработка: поддержка SSE и других стриминговых протоколов, минимальное потребление памяти при высоких нагрузках.
- Лёгкая расширяемость: официальная библиотека из десятков плагинов (AI, трафик, безопасность) покрывает >90% сценариев. Wasm-плагины изолированы в песочнице, безопасны для памяти, поддерживают несколько языков и горячее обновление без потери трафика.
- Безопасность и удобство: UI-консоль, готовые WAF- и CC-защиты, автоматическое получение бесплатных сертификатов через Let's Encrypt. Можно запустить одной командой Docker, даже без Kubernetes.
Сообщество и ресурсы
Проект благодарит Envoy и Istio за ценный вклад. Список контрибьюторов доступен на GitHub.
Вернуться к началу ↑
Комментарии
Комментариев пока нет. Будьте первым.