提示：本篇模型介绍同时适用于GPTW AI 1.0 和 GPTW AI 2.0，使用指南和积分消耗规则部分适用于GPTW AI 2.0

概要：目前主流AI模型按能力可分为“文本生成模型”；“图片生成模型”；“音乐生成模型”和“视频生成模型”。
其中，文本生成模型主要代表有OpenAI公司旗下的GPT模型系列模型、Anthropic公司旗下的Claude模型系列、Google公司旗下的Gemini模型系列；
图片生成模型主要代表有OpenAI公司旗下的Dall-e系列；搭载在Discord社区的Midjourney模型系列、开源的Stable Diffusion模型框架等；
音乐生成模型主要代表是近期新秀Suno；
视频生成模型主要代表有近期火出圈的Luma

1️⃣文本生成模型

积分消耗：在GPTW AI 2.0中，除特殊说明外，每次对话基础消耗：1积分，同时根据对话上下文长度计算token，大约每500字消耗1积分。
初级模型则消耗普通积分；高级模型消耗高级积分；绘画、音乐、视频模型统一消耗绘画积分

▶️ GPT-3.5

GPT3.5是OpenAI公司2022年底发布的一款通用生成式AI模型，最新版本名为GPT-3.5-Turbo，数据库时间截至2021年7月。该模型作为初代生成式自然语言处理模型，具有速度快、使用成本低等特点，但模型在处理复杂任务和逻辑问题、常识问题时犯错的几率较高

▶️ GPT-4.0

GPT4.0是OpenAI公司2023年初发布的新一代生成式AI模型，最新版本名为GPT-4o和GPT-4-Turbo，其中GPT-4o为目前的主流模型，数据库截至2023年10月，具备快速回复、回答质量高、视觉分析等特点，在处理复杂任务、长文本内容时，综合能力有非常显著的提升。该模型截至2024年6月，综合能力测验高于目前已知所有文本AI模型、适合用于论文写作辅助、编程、营销策划、数据分析等

GPT-4o是目前最新发布的模型版本，根据官网给出的测评数据，该模型在文本理解、图片解读、数据分析、音频理解翻译、视频理解等多个领域处于领先地位，不过目前仅开放了文本对话和图片分析，等待官方开放更多功能

GPT-4o可以直接识别图片内容，并根据指示进行分析解读等动作：

使用GPT-4o进行图片数据识别分析

▶️ GPT-4-PLUS（别名：GPT-4-All）

积分消耗：基础消耗2高级对话积分，每500字额外消耗2高级对话积分

该模型非官方API模型，而是来源于ChatGPT官网的PLUS订阅。我们后台有大量PLUS订阅账户提供服务，也就是说你无须额外购买PLUS订阅，利用该模型即可直接使用官网的相关功能，例如官网内置的绘画、联网搜索、图片识别、文件分析等插件

通过该模型，可以实现对PDF、Word、Excel、压缩包等文件格式的读取和分析，您只需在 文件中转站 上传您的文件，获取文件URL后以“文件URL+空格+给GPT的任务要求”这样的格式（用空格将链接和文本区分开），发送给GPT-4-PLUS即可，示例：

通过GPT-4-PLUS模型使用官网的文件分析功能

如果你的PDF、word等文本文件大小在3Mb以内，可以直接在对话框中上传；如果文件大小大于3Mb，则需要通过 文件中转站 上传您的文件。

GPT-4-PLUS的另一个突出能力便是内置的dalle绘画功能，您可以通过自然语言描述进行创作，GPT将会更具您的描述优化绘画Prompt，示例：

▶️ Claude-3

美国人工智能初创公司Anthropic与2024年3月发布的第三代大语言模型，拥有高级推理、视觉分析、代码生成、多语言处理能力，该模型对标ChatGPT、Gemini等产品，Claude 3系列旗舰模型Opus在本科和研究生水平的知识、数学和复杂任务理解方面能力出色

2024年6月，Claude-3.5-sonnet模型发布，根据官方介绍，该模型能力接近、甚至在部分领域超过GPT-4o模型，特别是专业领域文本推理、代码编写等方面。

▶️ Gemini

Google新一代生成式人工智能模型，相较之前版本优化了多语言、推理及编码能力，并新增视觉分析功能，综合能力接近GPT-4-Turbo，能快速理解并解决复杂任务，具有较高容量的上下文长度

▶️ Kimi

国内大语言模型，由Moonshot AI发布于2023年10月，综合能力无法与GPT-4系列进行比较，但具备超长文本并无损理解的特点，主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等，并自带联网搜索整理能力

2️⃣ 图片生成模型

图片生成领域各大模型能力参差不齐，个人偏好使用Dalle-3和Midjourney，上手简单，Midjourney出图质量高。在绘图之前，建议利用GPT对绘图prompt（指令）进行合理优化，提升最终出图效果

▶️ Dalle-3

OpenAI发布的AI绘画模型，特点在于能够与GPT进行协作交互，即用户只需要输入简单的指令，GPT将扩展为完整详细的Prompt再进行绘制；同时支持上下文连续对话，在与GPT对话的过程中对图片进行调整

▶️ Midjourney

Midjourney作为目前最流行的AI绘画模型，特点是出图质量高且上手难度低，仅需简单修饰绘画Prompt即可完成高质量的作品。同时多线程、快速绘制的能力能短时间生成多批次的图片，方便筛选满意的图片进行进一步加工。目前Midjourney已经广泛运用与广告设计、创意设计、脚本制作、平面设计、插画设计、服装设计、建筑园林设计、室内装修设计、IP设计等等领域。功能强大、可控性较强、使用成本较低的特性还在获得更多人的青睐

放大某张你中意的图片，即可进行扩展、变换、局部重绘等动作

ps：您可以直接将您的想法、创意等绘图关键词用中文输入，随后点击右侧的“优化“按钮，将自动翻译为自然且流畅的英文。英文指令下出图质量往往更佳！快来try一try吧~

▶️ Stable-Diffusion

stable-diffusion是一个具有悠久历史的开源AI绘画程序，我们通过多机部署将该模型接入GPTW。和Midjourney一样，stable-diffusion需要尽可能详细的绘画Prompt才能绘制出令人满意的图片，一方面这进一步提高了对图像细节的把控；另一方面则无疑加重了使用难度，新手很难快速绘制出令人满意的图片

3️⃣ 音乐生成模型

▶️ Suno-v3.5

音乐生成单次消耗：20绘画积分
每次生成两首歌曲，自带视频

Suno是AI初创公司Suno推出的音乐生成模型，无论用户是否拥有乐理知识，只需输入简单的提示词，比如音乐风格、音乐流派、歌词内容、音色等，等待几秒就能快速生成2首带有歌词和节拍的完整音乐。Suno-v3.5模型为2024年5月最新发布，拥有更细腻的人声和更真实自然的节拍，并且最长支持4分钟的音乐生成，可以说Suno是目前AI音乐生成领域的领头羊

在平台内您可以自定义歌曲的类型（有歌词或纯音乐）、歌曲风格、歌曲标题、歌词等元素，当您需要创作歌曲时，打开Suno-v3.5插件即可

4️⃣ 视频生成模型

▶️ Luma

视频生成单次消耗：30绘画积分

成立于2021年的Luma AI近期官宣了文生视频/图生视频模型Dream Machine，其视频生成能力只比OpenAI旗下的Sora！

无论时文本生成视频还是以图生成视频，Luma都能轻松应对，整体效果还是很不错的

在平台内您可以直接输入文本以生成视频，也可点击”图生视频“按钮，上传对应的图片，稍等片刻即可

当您需要生成视频时，打开左侧的Luma插件即可

GPTW.TOP