提示:本篇模型介绍同时适用于GPTW AI 1.0 和 GPTW AI 2.0,使用指南和积分消耗规则部分适用于GPTW AI 2.0
概要:目前主流AI模型按能力可分为“文本生成模型”;“图片生成模型”;“音乐生成模型”和“视频生成模型”。
其中,文本生成模型主要代表有OpenAI公司旗下的GPT模型系列模型、Anthropic公司旗下的Claude模型系列、Google公司旗下的Gemini模型系列;
图片生成模型主要代表有OpenAI公司旗下的Dall-e系列;搭载在Discord社区的Midjourney模型系列、开源的Stable Diffusion模型框架等;
音乐生成模型主要代表是近期新秀Suno;
视频生成模型主要代表有近期火出圈的Luma
1️⃣文本生成模型
积分消耗:在GPTW AI 2.0中,除特殊说明外,每次对话基础消耗:1积分,同时根据对话上下文长度计算token,大约每500字消耗1积分。
初级模型则消耗普通积分; 高级模型消耗高级积分; 绘画、音乐、视频模型统一消耗绘画积分

▶️ GPT-3.5
GPT3.5是OpenAI公司2022年底发布的一款通用生成式AI模型,最新版本名为GPT-3.5-Turbo,数据库时间截至2021年7月。该模型作为初代生成式自然语言处理模型,具有速度快、使用成本低等特点,但模型在处理复杂任务和逻辑问题、常识问题时犯错的几率较高
▶️ GPT-4.0
GPT4.0是OpenAI公司2023年初发布的新一代生成式AI模型,最新版本名为GPT-4o和GPT-4-Turbo,其中GPT-4o为目前的主流模型,数据库截至2023年10月,具备快速回复、回答质量高、视觉分析等特点,在处理复杂任务、长文本内容时,综合能力有非常显著的提升。该模型截至2024年6月,综合能力测验高于目前已知所有文本AI模型、适合用于论文写作辅助、编程、营销策划、数据分析等


GPT-4o是目前最新发布的模型版本,根据官网给出的测评数据,该模型在文本理解、图片解读、数据分析、音频理解翻译、视频理解等多个领域处于领先地位,不过目前仅开放了文本对话和图片分析,等待官方开放更多功能

GPT-4o可以直接识别图片内容,并根据指示进行分析解读等动作:
▶️ GPT-4-PLUS(别名:GPT-4-All)
积分消耗:基础消耗2高级对话积分,每500字额外消耗2高级对话积分
该模型非官方API模型,而是来源于ChatGPT官网的PLUS订阅。我们后台有大量PLUS订阅账户提供服务,也就是说你无须额外购买PLUS订阅,利用该模型即可直接使用官网的相关功能,例如官网内置的绘画、联网搜索、图片识别、文件分析等插件
通过该模型,可以实现对PDF、Word、Excel、压缩包等文件格式的读取和分析,您只需在 文件中转站 上传您的文件,获取文件URL后以“文件URL+空格+给GPT的任务要求”这样的格式(用空格将链接和文本区分开),发送给GPT-4-PLUS即可,示例:
如果你的PDF、word等文本文件大小在3Mb以内,可以直接在对话框中上传;如果文件大小大于3Mb,则需要通过 文件中转站 上传您的文件。
GPT-4-PLUS的另一个突出能力便是内置的dalle绘画功能,您可以通过自然语言描述进行创作,GPT将会更具您的描述优化绘画Prompt,示例:
▶️ Claude-3
美国人工智能初创公司Anthropic与2024年3月发布的第三代大语言模型,拥有高级推理、视觉分析、代码生成、多语言处理能力,该模型对标ChatGPT、Gemini等产品,Claude 3系列旗舰模型Opus在本科和研究生水平的知识、数学和复杂任务理解方面能力出色
2024年6月,Claude-3.5-sonnet模型发布,根据官方介绍,该模型能力接近、甚至在部分领域超过GPT-4o模型,特别是专业领域文本推理、代码编写等方面。

▶️ Gemini
Google新一代生成式人工智能模型,相较之前版本优化了多语言、推理及编码能力,并新增视觉分析功能,综合能力接近GPT-4-Turbo,能快速理解并解决复杂任务,具有较高容量的上下文长度
▶️ Kimi
国内大语言模型,由Moonshot AI发布于2023年10月,综合能力无法与GPT-4系列进行比较,但具备超长文本并无损理解的特点,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,并自带联网搜索整理能力
2️⃣ 图片生成模型
图片生成领域各大模型能力参差不齐,个人偏好使用Dalle-3和Midjourney,上手简单,Midjourney出图质量高。在绘图之前,建议利用GPT对绘图prompt(指令)进行合理优化,提升最终出图效果
▶️ Dalle-3
OpenAI发布的AI绘画模型,特点在于能够与GPT进行协作交互,即用户只需要输入简单的指令,GPT将扩展为完整详细的Prompt再进行绘制;同时支持上下文连续对话,在与GPT对话的过程中对图片进行调整

▶️ Midjourney
Midjourney作为目前最流行的AI绘画模型,特点是出图质量高且上手难度低,仅需简单修饰绘画Prompt即可完成高质量的作品。同时多线程、快速绘制的能力能短时间生成多批次的图片,方便筛选满意的图片进行进一步加工。目前Midjourney已经广泛运用与广告设计、创意设计、脚本制作、平面设计、插画设计、服装设计、建筑园林设计、室内装修设计、IP设计等等领域。功能强大、可控性较强、使用成本较低的特性还在获得更多人的青睐

放大某张你中意的图片,即可进行扩展、变换、局部重绘等动作
ps:您可以直接将您的想法、创意等绘图关键词用中文输入,随后点击右侧的“优化“按钮,将自动翻译为自然且流畅的英文。英文指令下出图质量往往更佳!快来try一try吧~
▶️ Stable-Diffusion
stable-diffusion是一个具有悠久历史的开源AI绘画程序,我们通过多机部署将该模型接入GPTW。和Midjourney一样,stable-diffusion需要尽可能详细的绘画Prompt才能绘制出令人满意的图片,一方面这进一步提高了对图像细节的把控;另一方面则无疑加重了使用难度,新手很难快速绘制出令人满意的图片

3️⃣ 音乐生成模型
▶️ Suno-v3.5
音乐生成单次消耗:20绘画积分
每次生成两首歌曲,自带视频
Suno是AI初创公司Suno推出的音乐生成模型,无论用户是否拥有乐理知识,只需输入简单的提示词,比如音乐风格、音乐流派、歌词内容、音色等,等待几秒就能快速生成2首带有歌词和节拍的完整音乐。Suno-v3.5模型为2024年5月最新发布,拥有更细腻的人声和更真实自然的节拍,并且最长支持4分钟的音乐生成,可以说Suno是目前AI音乐生成领域的领头羊
在平台内您可以自定义歌曲的类型(有歌词或纯音乐)、歌曲风格、歌曲标题、歌词等元素,当您需要创作歌曲时,打开Suno-v3.5插件即可
4️⃣ 视频生成模型
▶️ Luma
视频生成单次消耗:30绘画积分
成立于2021年的Luma AI近期官宣了文生视频/图生视频模型Dream Machine,其视频生成能力只比OpenAI旗下的Sora!
无论时文本生成视频还是以图生成视频,Luma都能轻松应对,整体效果还是很不错的
在平台内您可以直接输入文本以生成视频,也可点击”图生视频“按钮,上传对应的图片,稍等片刻即可
当您需要生成视频时,打开左侧的Luma插件即可
