基于模型的测试(英語:Model-based testing)属于软件测试领域的一种测试方法。按照此方法,测试用例可以完全或部分的利用模型自动产生。以上所说的模型通常是指对被测系统(SUT,system under test)某些(通常是功能性的)方面的描述。 模型一般都是对被测系统预期行为动作的...
7 KB (726 words) - 22:19, 20 January 2021
基于转换器的生成式预训练模型(英語:generative pre-trained transformers,GPT)是一种大型语言模型(LLM),也是生成式人工智慧的重要框架。首个GPT由OpenAI于2018年推出。GPT模型是基于Transformer模型的...
52 KB (4,298 words) - 15:28, 24 June 2025
在软件测试中,自动化测试指的是使用独立于待测软件的其他软件来自动执行测试、比较实际结果与预期并生成测试报告这一过程。 在测试流程已经确定后,测试自动化可以自动执行的一些重复但必要测试工作。也可以完成手动测试几乎不可能完成的测试。对于持续交付和持续集成的开发方式而言,测试自动化是至关重要的。...
20 KB (2,389 words) - 09:59, 8 June 2025
的输入数据。但是,最有效的模糊测试需要能够理解被测试对象的格式或者协议。这可以通过阅读设计规格来实现。基于设计规格的模糊工具包含完整的规格,并通过基于模型的测试生成方法去遍历规格,并在数据内容,结构,消息,序列中引入一些异常。这种“聪明的”模糊测试也被称作健壮性测试,句法测试,语法测试...
8 KB (1,004 words) - 01:28, 9 January 2025
此外大语言模型还展示了相当多的关于世界的常识,并且能够在训练期间“记住”大量事实。 虽然ChatGPT等大语言模型在生成类人文本方面表现出了卓越的能力,但它们很容易继承和放大训练数据中存在的偏差。这可能表现为对不同人口统计数据的歪曲表述或不公平待遇,例如基于种族、性别、语言和文化群体的不同观点与态度。...
62 KB (6,346 words) - 13:36, 9 June 2025
基於模型的設計(英語:Model-based design,簡稱MBD)是一種數學及可视化的方法,可以用來處理複雜控制系統、信號處理及通訊系統的設計。基於模型的設計可以用在運動控制、工業設計、航天以及車輛應用中。基於模型的設計也是嵌入式系統設計的方法論。 基於模型的設計是一種較有效率的...
8 KB (1,014 words) - 09:54, 21 March 2025
ChatGPT (category 基于转换器的生成式预训练模型)
Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年12月推出。该程序使用基于GPT-3.5、GPT-4、GPT-4o、GPT-4.5架构的大型语言模型並以强化学习训练。ChatGPT目前仍以文字方式互動,而除了可以用人類自然對話方式來互動,還可以用于甚為複雜的...
89 KB (8,390 words) - 04:18, 28 June 2025
Grok是xAI基于大型语言模型开发的生成式人工智慧聊天機器人,類似於ChatGPT。它能夠實時回答用戶的問題,並利用X社交媒體平台的數據進行回應。 2015年,埃隆·马斯克与萨姆·阿尔特曼共同创立OpenAI。2018年,由於埃隆·马斯克不認可OpenAI团队,他決定離開OpenAI董事会。...
9 KB (873 words) - 03:45, 18 June 2025
GPT-3 (redirect from 生成型預訓練變換模型 3)
生成型预训练變換模型 3 (英語:Generative Pre-trained Transformer 3,簡稱 GPT-3)是一個自迴歸語言模型,目的是為了使用深度學習生成人類可以理解的自然語言。GPT-3是由在舊金山的人工智能公司OpenAI訓練與開發,模型設計基於谷歌開發的 Transformer 語言模型...
13 KB (1,077 words) - 12:20, 25 June 2025
GPT-4.5 (category 基于转换器的生成式预训练模型)
5主要使用无监督学习进行训练,但也结合了监督微调及基于人类反馈的强化学习。模型训练基于Microsoft Azure平台。 山姆·奥特曼称GPT-4.5是一款“规模巨大且昂贵的模型”。 截至2025年2月,GPT-4.5的使用成本为每百万输入token 75美元,每百万输出token 150美元;而GPT-4o的成本则为每百万输入token...
5 KB (555 words) - 16:57, 18 March 2025
Mamba (深度学习架构) (redirect from Mamba (深度学习模型))
Mamba是一种用于序列建模任务的深度学习架构。它是由卡内基梅隆大学和普林斯顿大学的研究人员开发的,用于解决Transformer架构的一些局限性,尤其是在处理长序列方面。它基于结构化状态空间序列(S4)模型。 为了能够处理长数据序列,Mamba 采用了结构化状态空间序列模型 (S4)。 S4...
11 KB (1,287 words) - 06:46, 11 June 2025
基于人类反馈的强化学习(英語:reinforcement learning from human feedback,简称RLHF),包括基于人类偏好的强化学习(reinforcement learning from human preferences),是一种直接根据人类反馈训练“奖励模型”的...
8 KB (821 words) - 12:33, 25 April 2025
關鍵字驅動測試 自动化测试框架 测试驱动开发 元數據驅動測試(英语:Metadata-driven testing) 混合測試(英语:Hybrid testing) 基于模型的测试 Carl Nagle: Test Automation Frameworks[1] (页面存档备份,存于互联网档案馆)...
3 KB (505 words) - 12:24, 14 May 2024
LLaMA (category 大型语言模型)
AI)是Meta於2023年2月發布的大型语言模型。它訓練了各種模型,這些模型的參數從70億到650億不等。LLaMA的開發人員報告說,LLaMA運行的130億參數模型在大多數NLP基準測試中的性能超過了更大的、具有1750億參數的GPT-3提供的模型,且LLaMA的模型可以與PaLM和Chinchilla等最先進的模型...
21 KB (2,037 words) - 03:57, 8 June 2025
Simulink (category 数学模型)
测试,也可以進行基於模型的設計。 与MATLAB类似,Simulink的功能可以通过购买或自定义的工具箱不断扩展(例如Stateflow)。另外,Simulink与MATLAB紧密集成,可以直接访问MATLAB大量的工具来进行算法研发、仿真的分析和可视化、批处理脚本的创建、建模环境的...
4 KB (371 words) - 04:03, 3 February 2025
Gemini (聊天機器人) (category 含有連結內容需訂閱查看的頁面)
的生成式人工智慧聊天機器人。它基于同名的Gemini系列大型语言模型。是應對OpenAI公司開發的ChatGPT聊天機器人的崛起而開發的。其在2023年3月以有限的規模推出,2023年5月擴展到更多個國家。2024年2月8日從Bard更名为Gemini。 最初基於LaMDA系列大型語言模型...
64 KB (4,717 words) - 03:15, 23 June 2025
对于在大型和通用语料库上进行预训练的模型,通常通过重用模型的参数作为起点,并添加一个从头开始训练的任务特定层进行微调。 对整个模型进行微调也很常见,通常会产生更好的结果,但计算成本更高。 微调通常通过监督学习完成,但也有使用弱监督(英语:Weak supervision)进行模型微调的技术。 微调可以与基于人类反馈的...
11 KB (1,028 words) - 02:29, 23 January 2025
人工神经网络 (category 含有英語的條目)
模型)工具,神经网络通常是通过一个基于数学统计学类型的学习方法(learning method)得以优化,所以也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的...
27 KB (3,876 words) - 16:10, 5 March 2025
OpenAI o1 (category 含有英語的條目)
OpenAI o1是一个基于转换器的生成式预训练模型。2024年9月12日,OpenAI发布了o1的预览版,完整版本于2024年12月5日发布。 o1在回答问题之前会进行“思考”,使得它在处理复杂的任务、科学和编程方面比GPT-4o更优秀。 据泄露的信息显示,o1以前在OpenAI内部被称为“Q*”,后来更名为“草莓”。...
15 KB (1,459 words) - 14:14, 15 February 2025
GPT-4o (category 基于转换器的生成式预训练模型)
的新模型。 GPT-4o在语音、多语言和视觉基准测试中取得了最先进的成果,在音频语音识别和翻译领域创下了新纪录。GPT-4o在MMLU基准测试中的得分为88.7,而GPT-4的得分为86.5。 根据该公司的演示,GPT-4o将有效地将ChatGPT转变为可以进行实时语音对话的数字个人助理。...
9 KB (759 words) - 12:20, 25 June 2025
交叉熵 (category 自2018年2月需要专业人士关注的页面)
的情况下计算其交叉熵。例如在语言模型中, 我们基于训练集 T {\displaystyle T} 创建了一个语言模型, 而在测试集合上通过其交叉熵来评估该模型的准确率。 p {\displaystyle p} 是语料中词汇的真实分布,而 q {\displaystyle q} 是我们获得的语言模型...
4 KB (747 words) - 09:36, 11 November 2024
自适应学习 (category 自2019年4月缺少链入页面的条目)
更复杂的系统甚至包括说明解题思路的专家方法。 不包含专家模型的自适应学习系统通常将这些功能结合在教学模型中。 确定学生技能水平的最简单的方法是嵌入CAT(计算机化自适应测试)。在CAT,学习者会收到很多问题,问题的挑选基于与该学习者的假定技能水平相关的难易程度。随着测试的进行,根据他们的...
14 KB (1,999 words) - 12:30, 7 October 2022
Microsoft Copilot (section 集成OpenAI语言模型)
Microsoft Copilot是由微软开发的基于大型语言模型的聊天機器人,於2023年2月7日推出。它被視為Cortana的後繼產品。 Microsoft Copilot在Microsoft Bing和Microsoft Edge內被稱為Bing Chat 。 在Build 2023大会上,微软宣布Windows...
28 KB (2,805 words) - 16:55, 14 May 2025
OpenAI Codex (category 語言模型)
OpenAI为Codex发布了一个封闭测试版的API。2023年3月,OpenAI关闭了对Codex的访问。然而,由于来自研究者的公开呼吁,OpenAI改变了这一决定。现在,Codex模型仍可供OpenAI研究访问计划的研究者使用。 基于 GPT-3,一种在文本上训练的神经网络,Codex 还接受了来自...
6 KB (539 words) - 06:24, 14 January 2025
DeepSeek-V3 (category 大型语言模型)
5-Sonnet不相上下。特別是在數學能力測試中,該模型以優異成績超越了所有現有開源和閉源模型。 最引人注目的是DeepSeek-V3的低成本優勢。根據開源論文和DeepSeek披露,該大模型的訓練系基於2,048塊輝達H800型GPU(針對中國大陸市場的低配版GPU)叢集上執行55天完成;按每GPU小時2美元計算,模型全部訓練成本僅為557...
8 KB (1,102 words) - 04:38, 15 May 2025
碰撞测试假人是用来模拟车祸对人体的影响的真人一样大小的人體模型。 假人上装有许多测量撞击测试时产生的加载的传感器。在最佳情况下假人的生物力学性能应该和人体一样——比如身体各部分的大小和质量,以及关节的刚性,等等,只有这样使用它们的模拟才能和现实相匹配。不同的假人模拟男性或者女性的...
19 KB (3,138 words) - 23:16, 4 August 2023
Eclipse (category 自2018年12月缺少可靠来源的条目)
的源代码编辑器;XSD和WSDL的图形界面编辑器;Java企业版的“项目性质”(project nature)、建构器(builder)和模型(model),与一个Java企业版的导航(navigator);一个Web服务(Web service)向导和浏览器,还有一个WS-I测试工具;最后是数据库访问查询的工具与模型。...
14 KB (1,392 words) - 14:35, 27 March 2024
提示工程 (category 含有英語的條目)
engineering)是人工智能中的一个概念,特别是自然语言处理(NLP)。 在提示工程中,任务的描述会被嵌入到输入中。例如,不是隐含地给予模型一定的参数,而是以问题的形式直接输入。 提示工程的典型工作方式是将一个或多个任务转换为基于提示的数据集,并通过所谓的“基于提示的学习(prompt-based...
12 KB (1,507 words) - 07:47, 10 January 2025
Loop、SIL)、處理器在環(Processor in the Loop、PIL)、硬件在环(Hardware in the Loop、HIL)的方式進行開發。嵌入式系統會和環境的模型一起進行仿真。 基于模型的测试 Menno Mennenga, Christian Dziobek, Iyad Bahous: Modell- und...
2 KB (232 words) - 19:19, 4 February 2025
深度求索 (redirect from 对DeepSeek的审查)
的涵盖回答问题、解决逻辑问题、编写程序等基准测试中取得与其他聊天机器人不相上下的成绩。 DeepSeek的以相对较小的成本却获得极具竞争力的性能,被认为可能足以挑战美国人工智能领域模型优势地位。许多媒体将其描述为美国人工智能领域的“史普尼克危机”。其R1模型...
72 KB (6,660 words) - 05:26, 8 June 2025
核冬天 (category 含有缺少标题的引用的页面)
winter)是一個關於全球氣候變化的理論,它預測了大規模核子戰爭可能產生的氣候災難。核冬天理論認為使用大量的核武器,特別是對像城市這樣的易燃目標使用核武器,會讓大量的煙和煤煙進入地球的大氣層,這將可能導致非常寒冷的天氣。必须指出的是,核冬天是基于数据化模型的假设。然而,在最新的研究中,科学家更新了比上世纪更精确的计算模型...
140 KB (18,370 words) - 21:30, 20 May 2025