.png)
✨ SmallAI 功能特性一览
🧠功能特性
👁视觉识别
SmallAI 已经支持 OpenAI 的 gpt-4-vision
、谷歌的Gemini 1.5 Pro vision
、Anphropic的Claude 3.5 Sonnet
等具有视觉识别能力的大语言模型,这使得 SmallAI 具备了多模态交互的能力。用户可以轻松上传图片或者拖拽图片到对话框中,助手将能够识别图片内容,并在此基础上进行智能对话,构建更智能、更多元化的聊天场景。
在 SmallAI 内,模型中带有“👁”视觉图标的都是可使用视觉识别的AI模型
🎤语音会话(TTS & STT)
SmallAI 支持文字转语音Text-to-Speech,TTS
和语音转文字Speech-to-Text,STT
技术,我们的应用能够将文本信息转化为清晰的语音输出,用户可以像与真人交谈一样与我们的对话代理进行交流。
用户可以从多种声音中选择,给助手搭配合适的音源。 同时,对于那些倾向于听觉学习或者想要在忙碌中获取信息的用户来说,TTS 提供了一个极佳的解决方案。
在 SmallAI 中,我们精心挑选了一系列高品质的声音选项 OpenAI Audio, Microsoft Edge Speech
,以满足不同地域和文化背景用户的需求。用户可以根据个人喜好或者特定场景来选择合适的语音,从而获得个性化的交流体验。
🎨文生图、🎞文生视频、🎶文生音乐
SmallAI 支持最新的文本到图片生成技术,现在能够让用户在与助手对话中直接调用文成图工具进行创作。
通过利用 DALL-E 3
、MidJourney
、Suno
、Luma-Video
等 AI 工具的能力, 助手们现在可以将你的想法转化为图像、视频、甚至音频。同时可以更私密和沉浸式的完成你的创造过程。
🛠助手市场 Agent Market
在 SmallAI 的助手市场中,用户可以发现一个充满活力和创新的页面,它汇聚了众多精心设计的助手,这些助手不仅在工作场景中发挥着重要作用,也在学习过程中提供了极大的便利。
无论你的需求是什么,都可以在 SmallAI Agents
中找到
🌏超150款大模型支持
在 SmallAI 的不断发展过程中,我们深刻理解到在提供 AI 会话服务时模型服务商的多样性对于满足用户需求的重要性。因此,我们不再局限于单一的模型服务商,而是拓展了对多种模型服务商的支持,以便为用户提供更为丰富和多样化的会话选择。
通过这种方式,SmallAI 能够更灵活地适应不同用户的需求,同时也为不同需求的工作者提供了更为广泛的选择空间。
🌟已支持的模型系列
我们已将所有AI大模型的计费标准
以及模型名称
合并到此页面可查看
https://smallai-pro.feishu.cn/sheets/KoCXscVXKhyXXVt60BMciMdxnxh
我们已经实现了对以下模型服务商的支持:
Open AI (GPT3.5、GPT4、GPT4o、GPT4o mini):接入了OpenAI所有系列模型,包括GPTS也能够在SmallAI中进行使用,GPT系列模型通常是128K的最大长度上下文以及多模态能力较强
Google AI (Gemini Pro、Gemini Vision):接入了 Google 的 Gemini 系列模型,包括 Gemini 1.5 和 Gemini Pro,以支持更高级的语言理解和生成,最大上下文可达1M tokens
Anthropic (Claude):接入了 Anthropic 的 Claude 系列模型,包括 Claude 3 、Claude 3.5 多模态突破,超长上下文,树立行业新基准,以超快的速度以及超大的上下文支持领先,成为最受欢迎的模型之一
文心一言(ERNIE):国内百度公司自创模型,非常出色,也是国内比较受欢迎的模型之一,模型名称:ERNIE-Speed-128K
ChatGLM:加入了智谱的 ChatGLM 系列模型(GLM-4/GLM-4-vision/GLM-3-turbo),为用户提供了另一种高效的会话模型选择。
Moonshot AI (月之暗面):集成了 Moonshot 系列模型,这是一家来自国内的创新性 AI 创业公司,旨在提供更深层次的会话理解。
01.AI (零一万物):集成了零一万物模型,系列 API 具备较快的推理速度,这不仅缩短了处理时间,同时也保持了出色的模型效果。
Minimax: 接入了 Minimax 的 AI 模型,包括 MoE 模型 abab6,提供了更多的选择空间。
DeepSeek: 接入了 DeepSeek 的 AI 模型,包括最新的 DeepSeek-V2,提供兼顾性能与价格的模型。
Qwen (通义千问): 接入了 Qwen 的 AI 模型,包括最新的 qwen-turbo,qwen-plus 和 qwen-max 等模型。
NewBing (微软必应):支持实时联网的GPT-4(需要使用任意一种带风格的模型),模型名称:bing、bing-Creative、bing-Balanced、bing-Precise,建议指定风格来提升回复效果
Suno (支持最新3.5版本):模型名称suno-v3、suno-v3.5,支持全功能,支持歌词,支持商用(后台为订阅号)
Luma (文生视频模型):luma-video、luma-vip-video(速度快无水印)、pika-text-to-video
Midjourney官方接口(默认V6):支持最新版Midjourney Proxy Plus所有参数!已集成图片国内反代、Discord国内反代、中文翻译接口、违禁词自动检测,使用120刀官方账号快速Turbo模式超高并发
同时,我们也在计划支持更多的模型服务商,以进一步丰富我们的服务商库。
如果你希望让 SmallAI 支持你喜爱的服务商,欢迎联系我们SmallAI官方客服
📑文件上传与数据库管理
SmallAI 在最新版本中完成了 文件上传与知识库管理 新的里程碑
支持所有类型的文件上传,无论是文档
、图片
、音频
还是视频
文件,都可以轻松上传并存储。
你甚至可以将其作为一个不带文件夹功能的简易网盘来使用。
同时,为了保证在文件管理过程中的基本使用体验,我们提供了多选、批量删除和复制链接等基础文件操作功能,旨在简化文件管理任务,帮你高效地处理大量文件。
多种常见文件格式在线预览
目前支持如 PDF、Excel、Word、PPT 和 TXT 等多种常见文件格式的在线预览。无需离开 SmallAI 界面,就可以直接查看和审阅文件内容。
知识库管理
在界面的左侧菜单中,我们设计了一个清晰可见的知识库管理列表,展示了所有已创建的知识库。
文件分块与向量化
要说我们的知识库和网盘的最大区别,就在于我们支持对不同类型文件的「分块与向量化」、
分块相当于将文件按照特定结构拆分为文本片段(Chunk),而向量化则是将这些对应的文本片段转换为一串 [0.19,0.34,...]
这样的向量,在后续检索中用于语义化匹配查询。
正是分块与向量化的这个环节,才区别与传统网盘,让我们真正实现文件 / 知识库对话。
分块详情预览
同时在完成向量化后,我们还支持了向量化后的片段预览,点击分开即可查看分块详情。
对话中直接上传
我们认识到,大多数用户倾向于在对话框中上传文件。因此,我们对文件上传的交互设计进行了优化,增强了文件上传的预览与进度显示功能,使用户能够在上传过程中获得更清晰的反馈和更好的体验。
🔐 数据隐私性
在 SmallAI 内你的一切数据都会进行加密储存,保证用户的隐私性以及安全性,你可以大胆放心的使用,不会泄露你的任何隐私问题。
☁ Web应用安装(PWA)
我们深知在当今多设备环境下为用户提供无缝体验的重要性,你的所有数据都会自动同步在你的PC端以及移动端设备内
为此,我们采用了渐进式 Web 应用 PWA 技术,这是一种能够将网页应用提升至接近原生应用体验的现代 Web 技术。
通过 PWA,能够在桌面和移动设备上提供高度优化的用户体验,同时保持轻量级和高性能的特点。
在视觉和感觉上,我们也经过精心设计,以确保它的界面与原生应用无差别,提供流畅的动画、响应式布局和适配不同设备的屏幕分辨率。
Chrome / Edge 浏览器上运行
macOS/ Windows 下,使用 Chrome (谷歌浏览器) 安装的 PWA 时,必须要求 Chrome 是打开状态,否则会自动打开 Chrome 再打开 PWA 应用。