🧠功能特性

👁视觉识别

SmallAI 已经支持 OpenAI 的 gpt-4-vision 、谷歌的Gemini 1.5 Pro vision、Anphropic的Claude 3.5 Sonnet等具有视觉识别能力的大语言模型，这使得 SmallAI 具备了多模态交互的能力。用户可以轻松上传图片或者拖拽图片到对话框中，助手将能够识别图片内容，并在此基础上进行智能对话，构建更智能、更多元化的聊天场景。

在 SmallAI 内，模型中带有“👁”视觉图标的都是可使用视觉识别的AI模型

🎤语音会话（TTS & STT）

SmallAI 支持文字转语音Text-to-Speech，TTS和语音转文字Speech-to-Text，STT技术，我们的应用能够将文本信息转化为清晰的语音输出，用户可以像与真人交谈一样与我们的对话代理进行交流。

用户可以从多种声音中选择，给助手搭配合适的音源。同时，对于那些倾向于听觉学习或者想要在忙碌中获取信息的用户来说，TTS 提供了一个极佳的解决方案。

在 SmallAI 中，我们精心挑选了一系列高品质的声音选项 OpenAI Audio, Microsoft Edge Speech，以满足不同地域和文化背景用户的需求。用户可以根据个人喜好或者特定场景来选择合适的语音，从而获得个性化的交流体验。

🎨文生图、🎞文生视频、🎶文生音乐

SmallAI 支持最新的文本到图片生成技术，现在能够让用户在与助手对话中直接调用文成图工具进行创作。

通过利用 DALL-E 3、MidJourney 、Suno、Luma-Video 等 AI 工具的能力，助手们现在可以将你的想法转化为图像、视频、甚至音频。同时可以更私密和沉浸式的完成你的创造过程。

🛠助手市场 Agent Market

在 SmallAI 的助手市场中，用户可以发现一个充满活力和创新的页面，它汇聚了众多精心设计的助手，这些助手不仅在工作场景中发挥着重要作用，也在学习过程中提供了极大的便利。

无论你的需求是什么，都可以在 SmallAI Agents中找到

🌏超150款大模型支持

在 SmallAI 的不断发展过程中，我们深刻理解到在提供 AI 会话服务时模型服务商的多样性对于满足用户需求的重要性。因此，我们不再局限于单一的模型服务商，而是拓展了对多种模型服务商的支持，以便为用户提供更为丰富和多样化的会话选择。

通过这种方式，SmallAI 能够更灵活地适应不同用户的需求，同时也为不同需求的工作者提供了更为广泛的选择空间。

🌟已支持的模型系列

我们已将所有AI大模型的计费标准以及模型名称合并到此页面可查看

https://smallai-pro.feishu.cn/sheets/KoCXscVXKhyXXVt60BMciMdxnxh

我们已经实现了对以下模型服务商的支持：

Open AI (GPT3.5、GPT4、GPT4o、GPT4o mini)：接入了OpenAI所有系列模型，包括GPTS也能够在SmallAI中进行使用，GPT系列模型通常是128K的最大长度上下文以及多模态能力较强
Google AI (Gemini Pro、Gemini Vision)：接入了 Google 的 Gemini 系列模型，包括 Gemini 1.5 和 Gemini Pro，以支持更高级的语言理解和生成，最大上下文可达1M tokens
Anthropic (Claude)：接入了 Anthropic 的 Claude 系列模型，包括 Claude 3 、Claude 3.5 多模态突破，超长上下文，树立行业新基准，以超快的速度以及超大的上下文支持领先，成为最受欢迎的模型之一
文心一言（ERNIE）:国内百度公司自创模型，非常出色，也是国内比较受欢迎的模型之一，模型名称：ERNIE-Speed-128K
ChatGLM：加入了智谱的 ChatGLM 系列模型（GLM-4/GLM-4-vision/GLM-3-turbo），为用户提供了另一种高效的会话模型选择。
Moonshot AI (月之暗面)：集成了 Moonshot 系列模型，这是一家来自国内的创新性 AI 创业公司，旨在提供更深层次的会话理解。
01.AI (零一万物)：集成了零一万物模型，系列 API 具备较快的推理速度，这不仅缩短了处理时间，同时也保持了出色的模型效果。
Minimax: 接入了 Minimax 的 AI 模型，包括 MoE 模型 abab6，提供了更多的选择空间。
DeepSeek: 接入了 DeepSeek 的 AI 模型，包括最新的 DeepSeek-V2，提供兼顾性能与价格的模型。
Qwen (通义千问): 接入了 Qwen 的 AI 模型，包括最新的 qwen-turbo，qwen-plus 和 qwen-max 等模型。
NewBing (微软必应)：支持实时联网的GPT-4（需要使用任意一种带风格的模型），模型名称：bing、bing-Creative、bing-Balanced、bing-Precise，建议指定风格来提升回复效果
Suno (支持最新3.5版本)：模型名称suno-v3、suno-v3.5，支持全功能，支持歌词，支持商用（后台为订阅号）
Luma (文生视频模型)：luma-video、luma-vip-video（速度快无水印）、pika-text-to-video
Midjourney官方接口（默认V6）：支持最新版Midjourney Proxy Plus所有参数！已集成图片国内反代、Discord国内反代、中文翻译接口、违禁词自动检测，使用120刀官方账号快速Turbo模式超高并发

同时，我们也在计划支持更多的模型服务商，以进一步丰富我们的服务商库。

如果你希望让 SmallAI 支持你喜爱的服务商，欢迎联系我们SmallAI官方客服

📑文件上传与数据库管理

SmallAI 在最新版本中完成了 文件上传与知识库管理 新的里程碑

支持所有类型的文件上传，无论是文档、图片、音频还是视频文件，都可以轻松上传并存储。

你甚至可以将其作为一个不带文件夹功能的简易网盘来使用。

LobeChat 支持全类型文件存储

同时，为了保证在文件管理过程中的基本使用体验，我们提供了多选、批量删除和复制链接等基础文件操作功能，旨在简化文件管理任务，帮你高效地处理大量文件。

LobeChat 的文件管理支持常见的文件管理功能

多种常见文件格式在线预览

目前支持如 PDF、Excel、Word、PPT 和 TXT 等多种常见文件格式的在线预览。无需离开 SmallAI 界面，就可以直接查看和审阅文件内容。

在 LobeChat 中预览 PDF 文件

在 LobeChat 中预览 EXCEL 文件

在 LobeChat 中预览 Word 文件

在 LobeChat 中预览 PPT 文件

知识库管理

在界面的左侧菜单中，我们设计了一个清晰可见的知识库管理列表，展示了所有已创建的知识库。

创建知识库

知识库空状态

知识库文档管理

文件分块与向量化

要说我们的知识库和网盘的最大区别，就在于我们支持对不同类型文件的「分块与向量化」、

针对文件的一键分块与向量化

分块相当于将文件按照特定结构拆分为文本片段（Chunk），而向量化则是将这些对应的文本片段转换为一串 [0.19,0.34,...] 这样的向量，在后续检索中用于语义化匹配查询。

正是分块与向量化的这个环节，才区别与传统网盘，让我们真正实现文件 / 知识库对话。

分块详情预览

同时在完成向量化后，我们还支持了向量化后的片段预览，点击分开即可查看分块详情。

代码分块详情

对话中直接上传

我们认识到，大多数用户倾向于在对话框中上传文件。因此，我们对文件上传的交互设计进行了优化，增强了文件上传的预览与进度显示功能，使用户能够在上传过程中获得更清晰的反馈和更好的体验。

🔐 数据隐私性

在 SmallAI 内你的一切数据都会进行加密储存，保证用户的隐私性以及安全性，你可以大胆放心的使用，不会泄露你的任何隐私问题。

☁ Web应用安装（PWA）

我们深知在当今多设备环境下为用户提供无缝体验的重要性，你的所有数据都会自动同步在你的PC端以及移动端设备内

为此，我们采用了渐进式 Web 应用 PWA 技术，这是一种能够将网页应用提升至接近原生应用体验的现代 Web 技术。

通过 PWA，能够在桌面和移动设备上提供高度优化的用户体验，同时保持轻量级和高性能的特点。

在视觉和感觉上，我们也经过精心设计，以确保它的界面与原生应用无差别，提供流畅的动画、响应式布局和适配不同设备的屏幕分辨率。

Chrome / Edge 浏览器上运行

macOS/ Windows 下，使用 Chrome (谷歌浏览器) 安装的 PWA 时，必须要求 Chrome 是打开状态，否则会自动打开 Chrome 再打开 PWA 应用。

✨ SmallAI 功能特性一览

🧠功能特性

👁视觉识别

🎤语音会话（TTS & STT）

🎨文生图、🎞文生视频、🎶文生音乐

🛠助手市场 Agent Market