🧠功能特性

👁视觉识别

SmallAI 已经支持 OpenAI 的 gpt-4-vision 、谷歌的Gemini 1.5 Pro vision、Anphropic的Claude 3.5 Sonnet等具有视觉识别能力的大语言模型,这使得 SmallAI 具备了多模态交互的能力。用户可以轻松上传图片或者拖拽图片到对话框中,助手将能够识别图片内容,并在此基础上进行智能对话,构建更智能、更多元化的聊天场景

在 SmallAI 内,模型中带有“👁”视觉图标的都是可使用视觉识别的AI模型

🎤语音会话(TTS & STT

SmallAI 支持文字转语音Text-to-Speech,TTS语音转文字Speech-to-Text,STT技术,我们的应用能够将文本信息转化为清晰的语音输出,用户可以像与真人交谈一样与我们的对话代理进行交流。

用户可以从多种声音中选择,给助手搭配合适的音源。 同时,对于那些倾向于听觉学习或者想要在忙碌中获取信息的用户来说,TTS 提供了一个极佳的解决方案。

在 SmallAI 中,我们精心挑选了一系列高品质的声音选项 OpenAI Audio, Microsoft Edge Speech,以满足不同地域和文化背景用户的需求。用户可以根据个人喜好或者特定场景来选择合适的语音,从而获得个性化的交流体验。

🎨文生图、🎞文生视频、🎶文生音乐

SmallAI 支持最新的文本到图片生成技术,现在能够让用户在与助手对话中直接调用文成图工具进行创作

通过利用 DALL-E 3MidJourneySunoLuma-Video 等 AI 工具的能力, 助手们现在可以将你的想法转化为图像、视频、甚至音频。同时可以更私密和沉浸式的完成你的创造过程。

🛠助手市场 Agent Market

在 SmallAI 的助手市场中,用户可以发现一个充满活力和创新的页面,它汇聚了众多精心设计的助手,这些助手不仅在工作场景中发挥着重要作用,也在学习过程中提供了极大的便利

无论你的需求是什么,都可以在 SmallAI Agents中找到

🌏超150款大模型支持

在 SmallAI 的不断发展过程中,我们深刻理解到在提供 AI 会话服务时模型服务商多样性对于满足用户需求的重要性。因此,我们不再局限于单一的模型服务商,而是拓展了对多种模型服务商的支持以便为用户提供更为丰富和多样化的会话选择。

通过这种方式,SmallAI 能够更灵活地适应不同用户的需求,同时也为不同需求的工作者提供了更为广泛的选择空间。

🌟已支持的模型系列

我们已将所有AI大模型的计费标准以及模型名称合并到此页面可查看

https://smallai-pro.feishu.cn/sheets/KoCXscVXKhyXXVt60BMciMdxnxh

我们已经实现了对以下模型服务商的支持:

  • Open AI (GPT3.5、GPT4、GPT4o、GPT4o mini):接入了OpenAI所有系列模型,包括GPTS也能够在SmallAI中进行使用,GPT系列模型通常是128K的最大长度上下文以及多模态能力较强

  • Google AI (Gemini Pro、Gemini Vision):接入了 Google 的 Gemini 系列模型,包括 Gemini 1.5 和 Gemini Pro,以支持更高级的语言理解和生成,最大上下文可达1M tokens

  • Anthropic (Claude):接入了 Anthropic 的 Claude 系列模型,包括 Claude 3 、Claude 3.5 多模态突破,超长上下文,树立行业新基准,以超快的速度以及超大的上下文支持领先,成为最受欢迎的模型之一

  • 文心一言(ERNIE):国内百度公司自创模型,非常出色,也是国内比较受欢迎的模型之一,模型名称:ERNIE-Speed-128K

  • ChatGLM:加入了智谱的 ChatGLM 系列模型(GLM-4/GLM-4-vision/GLM-3-turbo),为用户提供了另一种高效的会话模型选择。

  • Moonshot AI (月之暗面):集成了 Moonshot 系列模型,这是一家来自国内的创新性 AI 创业公司,旨在提供更深层次的会话理解。

  • 01.AI (零一万物):集成了零一万物模型,系列 API 具备较快的推理速度,这不仅缩短了处理时间,同时也保持了出色的模型效果。

  • Minimax: 接入了 Minimax 的 AI 模型,包括 MoE 模型 abab6,提供了更多的选择空间。

  • DeepSeek: 接入了 DeepSeek 的 AI 模型,包括最新的 DeepSeek-V2,提供兼顾性能与价格的模型。

  • Qwen (通义千问): 接入了 Qwen 的 AI 模型,包括最新的 qwen-turbo,qwen-plus 和 qwen-max 等模型。

  • NewBing (微软必应):支持实时联网的GPT-4(需要使用任意一种带风格的模型),模型名称:bing、bing-Creative、bing-Balanced、bing-Precise,建议指定风格来提升回复效果

  • Suno (支持最新3.5版本):模型名称suno-v3、suno-v3.5,支持全功能,支持歌词,支持商用(后台为订阅号)

  • Luma (文生视频模型):luma-video、luma-vip-video(速度快无水印)、pika-text-to-video

  • Midjourney官方接口(默认V6):支持最新版Midjourney Proxy Plus所有参数!已集成图片国内反代、Discord国内反代、中文翻译接口、违禁词自动检测,使用120刀官方账号快速Turbo模式超高并发

同时,我们也在计划支持更多的模型服务商,以进一步丰富我们的服务商库。

如果你希望让 SmallAI 支持你喜爱的服务商,欢迎联系我们SmallAI官方客服

📑文件上传与数据库管理

SmallAI 在最新版本中完成了 文件上传与知识库管理 新的里程碑

支持所有类型的文件上传,无论是文档图片音频还是视频文件,都可以轻松上传并存储

你甚至可以将其作为一个不带文件夹功能的简易网盘来使用。

LobeChat 支持全类型文件存储

同时,为了保证在文件管理过程中的基本使用体验,我们提供了多选、批量删除和复制链接等基础文件操作功能,旨在简化文件管理任务,帮你高效地处理大量文件。

LobeChat 的文件管理支持常见的文件管理功能

多种常见文件格式在线预览

目前支持如 PDF、Excel、Word、PPT 和 TXT 等多种常见文件格式的在线预览。无需离开 SmallAI 界面,就可以直接查看和审阅文件内容。

在 LobeChat 中预览 PDF 文件

在 LobeChat 中预览 EXCEL 文件

在 LobeChat 中预览 Word 文件

在 LobeChat 中预览 PPT 文件

知识库管理

在界面的左侧菜单中,我们设计了一个清晰可见的知识库管理列表,展示了所有已创建的知识库。

创建知识库

知识库空状态

知识库文档管理

文件分块与向量化

要说我们的知识库和网盘的最大区别,就在于我们支持对不同类型文件的「分块与向量化」

针对文件的一键分块与向量化

分块相当于将文件按照特定结构拆分文本片段(Chunk),而向量化则是将这些对应的文本片段转换为一串 [0.19,0.34,...] 这样的向量,在后续检索中用于语义化匹配查询。

正是分块与向量化的这个环节,才区别与传统网盘,让我们真正实现文件 / 知识库对话。

分块详情预览

同时在完成向量化后,我们还支持了向量化后的片段预览,点击分开即可查看分块详情。

代码分块详情

对话中直接上传

我们认识到,大多数用户倾向于在对话框中上传文件。因此,我们对文件上传的交互设计进行了优化,增强了文件上传的预览与进度显示功能,使用户能够在上传过程中获得更清晰的反馈和更好的体验。

🔐 数据隐私性

在 SmallAI 内你的一切数据都会进行加密储存,保证用户的隐私性以及安全性,你可以大胆放心的使用,不会泄露你的任何隐私问题。

☁ Web应用安装(PWA)

我们深知在当今多设备环境下为用户提供无缝体验的重要性,你的所有数据都会自动同步在你的PC端以及移动端设备内

为此,我们采用了渐进式 Web 应用 PWA 技术,这是一种能够将网页应用提升至接近原生应用体验的现代 Web 技术

通过 PWA,能够在桌面和移动设备上提供高度优化的用户体验,同时保持轻量级和高性能的特点。

在视觉和感觉上,我们也经过精心设计,以确保它的界面与原生应用无差别,提供流畅的动画、响应式布局和适配不同设备的屏幕分辨率。

Chrome / Edge 浏览器上运行

macOS/ Windows 下,使用 Chrome (谷歌浏览器) 安装的 PWA 时,必须要求 Chrome 是打开状态,否则会自动打开 Chrome 再打开 PWA 应用。

(1)在电脑上运行 Chrome 或 Edge 浏览器

(2)访问 SmallAI 网页

(3)在地址栏的右上角,单击 安装 图标

(4)根据屏幕上的指示完成 PWA 的安装

移动端 浏览器上运行安装

(1)在移动设备上运行 Safari / 谷歌 / Edge 浏览器

(2)访问 SmallAI 网页

(3)在地址栏的右下角,找到 分享 图标

(4)点选 添加到屏幕 / 安装到屏幕

(5)根据屏幕上的指示完成 PWA 的安装