【AREA-introduction】LLM
Brief survey of LLM for project.
模型能力排行
综合能力:
分类能力:
信息抽取能力:
阅读理解能力:
数据分析能力:
quick link
大模型 | 机构 | 类别 | 链接 | 价格 | context | window | 发布时间 | 备注 |
---|---|---|---|---|---|---|---|---|
GPT-4 Turbo | openai | 商用 | https://openai.com/product | Input: $0.01 / 1K tokens Output: $0.03 / 1K tokens” | 128K | |||
GPT-4 | openai | 商用 | https://openai.com/product | “Input: $0.03 / 1K tokens Output: $0.06 / 1K tokens” | ~25K | |||
GPT-4-32K | openai | 商用 | https://openai.com/product | “Input: $0.06 / 1K tokens Output: $0.12 / 1K tokens” | 32K | |||
GPT-3.5-turbo-1106 | openai | 商用 | https://openai.com/product | “ $0.0010 / 1K tokens $0.0020 / 1K tokens” | 16K | |||
GPT-3.5-turbo-instruct | openai | 商用 | https://openai.com/product | “ $0.0015 / 1K tokens $0.0020 / 1K tokens” | 4K | |||
Claude Instant | Anthropic | 商用 | https://www.anthropic.com/product | “$0.80/million tokens $2.40/million tokens” | 100K | |||
Claude 2.0 | Anthropic | 商用 | “$8.00/million tokens $24.00/million tokens” | 100K | ||||
Claude 2.1 | Anthropic | 商用 | “$8.00/million tokens $24.00/million tokens” | 200K | ||||
Gemini Pro | 谷歌 | 商用 | https://deepmind.google/technologies/gemini/#introduction | “free:60 chat / min In: $0.00025 / 1K characters ou:$0.0005 / 1K char” | 不得超过 4MB | |||
PaLM | 谷歌 | 商用 | ||||||
Bard | 谷歌 | 商用 | ||||||
文心一言4.0(ERNIE-Bot 4.0) | 百度 | 商用 | “¥0.12 / 1K tokens ¥0.12 / 1K tokens” | 2023.6 | 价格网页 | |||
文心一言3.5 8K(ERNIE-Bot-8K) | 百度 | 商用 | “¥0.024 / 1K tokens ¥0.048 / 1K tokens” | 大模型平台 | ||||
文心一言3.5(ERNIE-Bot) | 百度 | 商用 | “¥0.012 / 1K tokens ¥0.012 / 1K tokens” | chat页面 | ||||
文心一言EB-turbo-AppBuilder专用版 | 百度 | 商用 | “¥0.008 / 1K tokens ¥0.008 / 1K tokens” | |||||
讯飞星火v3.0 | 科大讯飞 | 商用 | https://xinghuo.xfyun.cn/sparkapi ~¥0.03 / 1K tokens | 免费试用很多 | ||||
讯飞星火v1.5 | 科大讯飞 | 商用 | ~¥0.015 / 1K tokens | |||||
腾讯混元标准版 | 腾讯 | 商用 | https://cloud.tencent.com/product/hunyuan | ¥0.01 / 1K | ||||
腾讯混元高级版 | 腾讯 | 商用 | https://cloud.tencent.com/product/hunyuan | ¥0.1 / 1K | ||||
“天工 SkyChat-MegaVerse” | 昆仑万维 | 商用 | https://model-platform.tiangong.cn/?channel=csearch_enter&utm_medium=csearch | ¥0.005 / 1K | 做一个agent活动针对长文本 | |||
AGI Sky-Saas-Search | 昆仑万维 | 商用 | ¥0.18 / 1K | 针对搜索 | ||||
AGI Sky-Saas-Writing | 昆仑万维 | 商用 | 需要咨询 | 针对写作 | ||||
Skywork-13B-Base | 昆仑万维 | 开源 | https://model-platform.tiangong.cn/ | 开源 | 4K | |||
Baichuan2-Turbo | 百川智能 | 商用 | https://www.baichuan-ai.com/home | 0.008元/千tokens | ||||
Baichuan2-Turbo-192k | 百川智能 | 商用 | 0.016元/千tokens | 192K | ||||
Baichuan2-53B | 百川智能 | 商用 | “8点前0.01元/千tokens 其余时间0.02” | |||||
Baichuan2-7B | 百川智能 | 开源 | 开源 | 4K | ||||
Baichuan2-13B | 百川智能 | 开源 | 开源 | 4K | ||||
baichuan-7B | 百川智能 | 开源 | 开源 | 4K | ||||
baichuan-13B-chat | 百川智能 | 开源 | https://github.com/baichuan-inc/Baichuan-13B | 开源 | 4K | |||
华为盘古 | 华为 | |||||||
ChatGLM-6B | 智谱AI | 开源 | 开源 | github | ||||
智谱清源 | 智谱AI | 商用 | ||||||
360智脑 | 奇虎360 | 商用 | https://ai.360.cn/ | |||||
通义千问 | 阿里巴巴 | 商用 | https://tongyi.aliyun.com | |||||
通义千问Qwen-1.8B | 阿里巴巴 | 开源 | 开源 | 32K | github | |||
通义千问Qwen-7B | 阿里巴巴 | 开源 | 开源 | 32K | ||||
通义千问Qwen-14B | 阿里巴巴 | 开源 | 开源 | 8K | ||||
通义千问Qwen-72B | 阿里巴巴 | 开源 | 开源 | 32K | ||||
minimax | minimax | 商用 | https://api.minimax.chat | |||||
tigerbot-7b-chat | 虎博科技 | 商用/开源 | https://www.tigerbot.com/ | 0.018元 / 千tokens | api界面 | |||
tigerbot-13b-chat | 虎博科技 | 商用 | https://tigerbot.com/api-reference/chat | 0.02元 / 千tokens | ||||
tigerbot-70b-chat | 虎博科技 | 0.04元 / 千tokens | ||||||
chatglm-6b | 清华大学&智谱AI | 开源 | https://github.com/THUDM/ChatGLM-6B 开源 | |||||
LLaMA-2 | META | 开源 | 开源 | |||||
LlaMA-13B | META | 开源 | 开源 | |||||
Kimi Chat | 月之暗面 | 商用 | https://www.yjpoo.com/site/1809.html | chat | ||||
belle-llama-7b-2m | 链家科技 | 开源 | https://github.com/LianjiaTech/BELLE | 开源 | ||||
BELLE-on-Open-Datasets | 链家科技 | 开源 | https://github.com/LianjiaTech/BELLE | 开源 | ||||
belle-llama-13b-2m | 链家科技 | 开源 | https://github.com/LianjiaTech/BELLE | 开源 | ||||
belle-llama-13b-ext | 链家科技 | 开源 | https://github.com/LianjiaTech/BELLE | 开源 | ||||
Ziya-LLaMA-13B-v1 | IDEA研究院 | 开源 | https://mp.weixin.qq.com/s/IeXgq8blGoeVbpIlAUCAjA | 开源 | ||||
phoenix-inst-chat-7b | 港中文 | 开源 | https://github.com/FreedomIntelligence/LLMZoo | 开源 | ||||
linly-chatflow-13b | 深圳大学 | 开源 | https://github.com/CVI-SZU/Linly | 开源 | ||||
MOSS-003-SFT | 复旦大学 | 开源 | https://github.com/OpenLMLab/MOSS | 开源 | ||||
AquilaChat-7B | 智源研究院 | 开源 | https://github.com/FlagAI-Open/FlagAI/blob/master/examples/Aquila/README.md | 开源 | ||||
tulu-30b | allenai | 开源 | https://github.com/allenai/open-instruct | 开源 |
info
参数 | 显存(推理) | 显存(微调) | 备注 |
---|---|---|---|
70B模型 | ~48GB | ~62GB | |
14B模型 | ~13GB | ~19GB | |
7B模型 | ~8GB | ~12GB | |
2B模型 | ~3GB | ~6GB |
上下文窗口:
192K大约是35万汉字,100K大约8万汉字,32K大约2.5万字
database
- MySQL
- MongoDB
- Redis
- Chroma is the open-source embedding database.
- Weaviate is an open source, AI-native vector database
- Milvus向量数据库
- pinecone
agent
AutoGPT:
ProAgent:
项目地址:https://github.com/OpenBMB/ProAgent
文章:https://arxiv.org/abs/2311.10751- 自动建立workflow,并在需要时由LLM介入动态决策
- 数据流(如写长报告)和控制流(如分支判断)时由agent介入
- 针对数据流建立了Agentic Workflow Description Language,一种JSON格式的描述来方便LLM内部通信,避免错误
- 针对控制流用python
- 自动建立workflow,并在需要时由LLM介入动态决策
MetaGPT:
主要是一个多专业agent协作完成编码的框架。
论文:https://arxiv.org/abs/2308.00352
受人类的SOPs(标准工作流程)启发,Meta完成了一个元编程框架,需要agent输出结构化的输出,并且以此来提高表现。重点在于每一个agent的输出都是高度结构化的高质量documents, design artifacts, flowcharts, and interface specifications.CAMEL:还在持续更新*
为了解决用户并不是能很好地编写prompt的问题而产生
目标是使用最少的人类输入,也就是用户输入非常少,随后由agent来细化来实现目标的路径和方法- 角色扮演框架
- 开源了一些代理、pipeline和分析工具
论文:https://arxiv.org/abs/2303.17760
项目地址:https://github.com/camel-ai/camel
babyAGI:
项目地址:https://github.com/yoheinakajima/babyagi
实操地址:https://huggingface.co/spaces/NeuralInternet/BabyAGI
使用gpt-3.5/Llama,是一个脚本,包含了一个取任务,完成任务的工作流程Jarvis/HuggingGPT:
Microsoft,由一个LLM作为中央controller,分割任务,控制协调另外的专业agent协助完成项目
项目地址https://github.com/microsoft/JARVISCohere:
一个第三方RAG system allows LLMs to accurately answer questions and solve tasks using enterprise data as the source of truth
https://cohere.com/COGNOSYS:
https://www.cognosys.ai/Doanythingmachine:
https://www.doanythingmachine.com/alphakit.ai:
手机app构建agent
https://alphakit.ai/
项目地址:https://github.com/agiresearch/OpenAGIAGIXT:
项目地址:https://github.com/Josh-XT/AGiXT