ChatGLM

访问网站

ChatGLM，清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人，基于千亿基座模型 GLM-130B，注入代码预训练，通过有监督微调等技术实现人类意图对齐，具备问答、多轮对话、代码生成功能的中英双语大模型。

ChatGLM-6B具备以下特点：

充分的中英双语预训练：ChatGLM-6B在1:1比例的中英语料上训练了1T的token量，兼具双语能力。

优化的模型架构和大小：吸取GLM-130B训练经验，修正了二维RoPE位置编码实现，使用传统FFN结构。6B（62亿）的参数大小，也使得研究者和个人开发者自己微调和部署ChatGLM-6B成为可能。

较低的部署门槛：FP16 半精度下，ChatGLM-6B 需要至少 13 GB 的显存进行推理，结合模型量化技术，这一需求可以进一步降低到 10GB（INT8）和 6GB（INT4），使得 ChatGLM-6B 可以部署在消费级显卡上。

更长的序列长度：相比 GLM-10B（序列长度1024），ChatGLM-6B序列长度达2048，支持更长对话和应用。

人类意图对齐训练：使用了监督微调（Supervised Fine-Tuning）、反馈自助（Feedback Bootstrap）、人类反馈强化学习（Reinforcement Learning from Human Feedback）等方式，使模型初具理解人类指令意图的能力。输出格式为markdown，方便展示。

相似站点

即创：一触即发，创意无限

即创平台是：流程更完善、功能更智能、资源更整合、生态更开放的一站式创意生产平台，通过更完善流程、更智能功能、更整合资源、更开放生态，帮助客户生产提效、服务商快速成长，撬动高质量供给，激发供给生态繁荣。属于抖音旗下的产品。

　Jº
讯飞星火

科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。懂你所言，答你所问，创你所需，解你所难，学你所教

　Jº
天工AI搜索

天工AI搜索引擎采用大语言模型技术，能够通过对话式交互理解用户意图，提供精准、个性化的答案。与传统搜索引擎相比，天工 AI 搜索具备更好的信息提取能力、知识生成能力和意图识别能力。此外，天工AI搜索也即将具备图像、语音等多模态搜索能力，更大程度地释放生产力、提升用户效率。

　Jº
AI Design

AI Design 是腾讯自主研发的智能设计平台，利用人工智能技术生成品牌 logo，旨在帮助个人用户（现已支持 QQ 和微信用户）以高效率和低成本激发品牌灵感。使用简单，仅需3步(输入品牌名称、选择关键词和偏好颜色)，即可获得多种 logo 方案。使用AI Design在线生成品牌 logo 仅需10秒，内测期间，AIDesign 将免费开放全部功能，支持 logo 的智能设计、调优、VI 生…

　Jº
百川智能

百川智能成立于2023年4月10日，由前搜狗公司CEO王小川创立。公司以帮助大众轻松、普惠地获取世界知识和专业服务为使命，致力于通过语言AI的突破，构建中国最优秀的大模型底座。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。百川智能成立不到100天，便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型，且在多个权威评测榜单均…

　Jº
通义千问

通义千问，是阿里云推出的一个超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有文案创作能力，能够续写小说，编写邮件等。通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat 8月3日上架魔搭社区，两款模型均开源、免费、可商用。

　Jº
文心一言

文心一言（英文名：ERNIE Bot）是百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型，基于飞桨深度学习平台和文心知识增强大模型，持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色

　Jº

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

相似站点

即创：一触即发，创意无限

即创平台是：流程更完善、功能更智能、资源更整合、生态更开放的一站式创意生产平台，通过更完善流程、更智能功能、更整合资源、更开放生态，帮助客户生产提效、服务商快速成长，撬动高质量供给，激发供给生态繁荣。属于抖音旗下的产品。
讯飞星火

科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。懂你所言，答你所问，创你所需，解你所难，学你所教
天工AI搜索

天工AI搜索引擎采用大语言模型技术，能够通过对话式交互理解用户意图，提供精准、个性化的答案。与传统搜索引擎相比，天工 AI 搜索具备更好的信息提取能力、知识生成能力和意图识别能力。此外，天工AI搜索也即将具备图像、语音等多模态搜索能力，更大程度地释放生产力、提升用户效率。
AI Design

AI Design 是腾讯自主研发的智能设计平台，利用人工智能技术生成品牌 logo，旨在帮助个人用户（现已支持 QQ 和微信用户）以高效率和低成本激发品牌灵感。使用简单，仅需3步(输入品牌名称、选择关键词和偏好颜色)，即可获得多种 logo 方案。使用AI Design在线生成品牌 logo 仅需10秒，内测期间，AIDesign 将免费开放全部功能，支持 logo 的智能设计、调优、VI 生…
百川智能

百川智能成立于2023年4月10日，由前搜狗公司CEO王小川创立。公司以帮助大众轻松、普惠地获取世界知识和专业服务为使命，致力于通过语言AI的突破，构建中国最优秀的大模型底座。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。百川智能成立不到100天，便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型，且在多个权威评测榜单均…
通义千问

通义千问，是阿里云推出的一个超大规模的语言模型，功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互，也融入了多模态的知识理解，且有文案创作能力，能够续写小说，编写邮件等。通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat 8月3日上架魔搭社区，两款模型均开源、免费、可商用。