资讯处理语言(英語:Information Processing Language,缩写为IPL),一种程式语言,于1954年由艾伦·纽厄尔、克里夫·肖(Cliff Shaw)、赫伯特·西蒙等人于兰德公司与卡内基技术学院研发。它被认为是史上第一个用于人工智慧(早期的基于符号处理...
2 KB (140 words) - 12:30, 18 May 2021
自然語言處理(英語:Natural Language Processing,缩写作 NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言處理包括多方面和步骤,基本有认知、理解、生成等部分。 自然語言認知和理解是讓電腦把输入的語言变成有意思的符号和关系,然后根据目的再處理...
21 KB (2,586 words) - 12:19, 7 February 2025
w_{m})} 。通過语言模型,可以确定哪个词语出现的可能性更大,或者通過若干上文语境词来预测下一个最可能出现的词语。 語言模型經常使用在許多自然語言處理方面的應用,如語音識別,機器翻譯,詞性標註,句法分析,手写体识别和資訊檢索。由於字詞與句子都是任意組合的長度,因此在訓練過的語言...
10 KB (1,696 words) - 09:44, 6 February 2025
Chen)(1987年—)是臺灣的計算機科學家,現任國立臺灣大學資訊工程學系教授。她的研究領域涵蓋語音理解、自然語言處理、深度學習、機器智慧與口語對話系統,特別專注於語音語言理解、多輪對話系統以及深度學習在語言技術中的應用。陳縕儂是臺大資工系歷來最年輕的教授之一。 陳縕儂於美國卡內基美隆大學語言科技研究所(英语:Language...
8 KB (1,185 words) - 03:40, 23 April 2025
檢索增強生成 (category 自然語言處理)
) 是赋予生成式人工智能模型資訊檢索能力的技术。檢索增強生成最佳化大型语言模型(LLM) 的交互方式,讓模型根据指定的一组文件回應使用者的查詢,并使用这些資訊增强模型从自身庞大的静态训练数据中提取的資訊。檢索增強生成技術促使大型語言模型能够使用特定领域或更新後的資訊...
1 KB (131 words) - 12:35, 3 January 2025
李琳山 (category 國立臺灣大學電機資訊學院校友)
陳縕儂:國立臺灣大學資訊工程學系教授。主要研究領域語言理解、對話系統、機器智慧、自然語言處理。 張振豪:國立中興大學電機工程學系終身特聘教授。主要研究領域混合訊號積體電路設計、系統晶片與訊號處理系統。 陳柏琳:國立臺灣師範大學 資訊工程學系教授。中華民國計算語言學學會理事長。主要研究領域語音辨識、資訊檢索、自然語言處理、機器學習。 科學月刊...
8 KB (662 words) - 03:26, 23 April 2025
意藍資訊(英語:eLAND Information Co., Ltd.;簡稱:意藍資訊,eLAND)為臺灣的資訊軟體公司,提供搜尋檢索、自然語言處理、網路社群分析與第三方資料串接之服務。 2007年由國立台灣大學資訊管理學系博士生楊立偉創立,2011年後轉型為社群資料分析的軟體即服務(SAAS)模式...
5 KB (370 words) - 22:55, 20 May 2025
基本的計算機科學主題列表 (section 程式語言及編譯器)
是建立在關係模型基礎上的數據庫,借助於集合代數等數學概念和方法來處理數據庫中的數據。 資料挖掘 - 在文件或資料庫中搜尋及處理資訊的演算法研究;跟資訊檢索很像. 人工智慧 - 系統可以展示其智慧或行為的研究及執行。 自動推理 - 解決的引擎像是用在Prolog,這種語言可以從規則資料庫中查詢出來的結果來產生一些步驟。...
6 KB (916 words) - 11:00, 22 May 2025
關連式資料庫的概念引入了与程式語言無關的結構化查詢語言(SQL),是以關係代數為其基礎。 「資料」(data)和「資訊」(information)有著不同的内涵。只要是儲存的内容都可以稱為資料,但這其中仅有以組織及有意義的方式呈現的才是資訊。世界上大部份的資料沒有結構,儲存在不同的實...
20 KB (2,187 words) - 21:44, 22 February 2025
Conference(英语:Message Understanding Conference), MUC(英语:MUC)),這個會議主要提倡利用自然語言處理技術,對文字資訊作更深度的剖析,以提高資訊檢索的認知程度。從1987年第一屆會議迄今,MUC(英语:Message Understanding...
4 KB (588 words) - 06:08, 11 November 2024
聊天機器人 (category 大型语言模型)
聊天機器人(英語:chatbot)是由對話或文字進行交談的電腦程式,能夠模擬人類對話並通過圖靈測試,也可具備實用性,如客戶服務或資訊獲取。 有些聊天機器人會搭載自然語言處理系統,但大多簡單的系統只會擷取輸入的關鍵字,再從語料庫中找尋最合適的應答句。目前,聊天機器人是虛擬助理的一部分,可以與許多組織的...
15 KB (1,993 words) - 07:55, 21 March 2025
聯邦資訊處理標準(英語:Federal Information Processing Standards,缩写FIPS)是美國聯邦政府制定給所有軍事機構除外的政府機構及政府的承包商所使用的公開標準。許多FIPS標準都是從廣泛的社會標準修改而來的(像ANSI,IEEE,ISO等等)。...
1 KB (129 words) - 07:44, 13 April 2023
語言的機制。 資訊在包括語言相關區域的更大系統中交換。這些區域通過白質的神经纖維束連接,這使得區域之間的信息傳輸成為可能。在提出有可能在多個語言中心之間建立聯繫之後,人們認為白質纖維束對語言的產生很重要。涉及語言產生和處理的三個古典語言區域是布洛卡區、韋尼克區以及角回,其中前二者通过弓状束相连。...
4 KB (486 words) - 04:47, 23 July 2022
方式,事件驅動程式模型下的系統,基本上的架構是預先設計一個事件迴圈所形成的程序,這個事件迴圈程序不斷地檢查目前要處理的資訊,根據要處理的資訊執行一個觸發函式進行必要的處理。其中這個外部資訊可能來自一個目錄夾中的檔案,可能來自鍵盤或滑鼠的動作,或者是一個時間事件。 對一個事件驅動(event...
4 KB (633 words) - 17:24, 12 February 2024
編程語言提供的物件導向設計或模块化编程機制,就是允許開發人員提供SoC的機制。例如,C#,C++,Delphi和 Java等物件導向的編程語言可以將關注點分解為物件,像MVC或MVP這樣的架構設計模式,將內容從呈現和數據處理...
14 KB (1,917 words) - 12:13, 22 December 2024
第四代程式語言(fourth-generation programming language)簡稱4GL,是指在程式語言世代分類中,在第三代编程语言(3GL)之上的电子计算机编程语言。例如Clipper、SQL、SAS、MATLAB都是第四代程式語言。 每一世代的程式語言都希望程式的抽象程度越高,越不用處理...
3 KB (371 words) - 09:59, 29 January 2020
备、人等等。有些介面(例如觸控式螢幕)是雙向的,可以傳送資訊,同時接收資訊,有些介面(例如滑鼠或喇叭)則是單向的,只能傳送或接收資訊。人類與電腦等資訊機器或人類與程式之間的介面稱為使用者介面。電腦等資訊機器硬體元件間的介面叫硬體介面。電腦等資訊機器軟體元件間的介面叫軟體介面,其存在於分離的軟體元件間,並提供一種機制使這些元件可以溝通。...
14 KB (1,623 words) - 00:03, 12 May 2025
領域特定語言(英語:Domain-specific language,縮寫:DSL),也稱為特定域語言,是專門針對特定應用領域的计算机语言,和可以用在多種領域的通用語言(英语:general-purpose language)(GPL)恰好相反。像HTML專門用在網頁設計上,就屬於領域特定語言...
9 KB (1,368 words) - 08:46, 8 February 2024
詞彙標示框架 (category 自然語言處理)
大型詞彙庫、簡單或複雜詞彙庫,乃至於書面或口語詞彙表述。說明的範疇包含構詞學、語法學、計算語意學及電腦輔助翻譯。涵蓋的語言包括所有自然語言,並不侷限於歐洲地區。此計畫在自然語言處理的運用上不受限制。詞彙標示框架能呈現多數辭典,包括WordNet、EDR及PAROLE。...
8 KB (1,152 words) - 07:21, 17 May 2021
語言表達能力(英語:Expressive language skills)指的是把腦海中的想法轉換為符合邏輯及文法的詞彙和句子的能力。語言表達能力包含面部表情、手势、意向性、词汇、语义学、形态学和语法学等。 語言表達能力的缺陷可能與語言發育遲緩、聽力受損有關。語言表達能力也可能和腦中的資訊處理、自閉症、X染色體易裂症和學習方式有關。...
3 KB (223 words) - 13:44, 18 September 2021
問答系統 (category 自然语言处理任务)
答「特朗普是美國總統」。面對這種系統,使用者不需要費心去一一檢視搜尋引擎回傳的網頁,對於資訊檢索的效率與資訊的普及都有很大幫助。從系統內部來看,問答系統使用了大量有別於傳統資訊檢索系統自然語言處理技術,如自然語言剖析(Natural Language Parsing)、問題分類(Question...
17 KB (2,200 words) - 12:11, 7 February 2025
关于逻辑机器的理论工作,也是首先將問題知识(將規則表示為輸入數據)與問題解決策略(通用求解器引擎)分離開來的電腦程式。通用解难器是以三階編程語言「資訊處理語言」(IPL)來實現。 虽然通用解难器能够解決一些诸如河内塔等可被充分形式化的簡單問題,但無法用來解決現實世界中的問題,這是因为搜索很容易在组...
4 KB (618 words) - 13:24, 6 March 2022
命題表徵(英语:Propositional_representation) 語言 语言学 语音学 音位學 语法 语言习得 转换-生成文法 乔姆斯基谱系 普遍文法 語言相對論 心語假說 大腦中的語言處理(英语:Language_processing_in_the_brain) 分类 思考 解决问题...
12 KB (1,540 words) - 19:11, 28 December 2024
自然語言生成(NLG)是自然語言處理的一部分,從知識庫或邏輯形式(英语:Logic Form (Linguistics))等等機器表述系統去生成自然語言。這種形式表述當作心理表述的模型時,心理語言學家會選用語言產出(英语:language production)這個術語。 自然語言...
13 KB (1,688 words) - 01:23, 23 January 2025
文、维吾尔文等大量中國少數民族的文字,周邊國家的日語假名、諺文,还包括古汉语文字、西夏文、契丹文等各種不同的文字。 中文信息處理可以從硬體及軟體兩方面去看,以下詳述中文信息處理的發展歷史、現況及未來發展等多方面的面貌。 基础研究:汉字字符集及編碼、汉字字频统计、词频统计、汉语自动分词、句法属性研究、...
17 KB (2,519 words) - 15:27, 11 February 2025
在Scheme語言和某些其他語言,字串流是一個惰性求值。字串流可以用類似list的方式使用。因此字串流可以用來表示無限序列和無窮級數. 在Smalltalk標準程式庫和一些程式語言中,字串流是一種外部迭代器。在這個概念裡面,字串流可以用來代表有限或者無限的序列。 串流处理—在平行計算裡面,特別是圖像處理...
3 KB (318 words) - 12:46, 5 November 2024
計算語言學,亦稱電腦語言學(英語:computational linguistics)是一門跨學科的研究領域,試圖找出自然語言的規律,建立運算模型,最終讓電腦能夠像人類般分析,理解和處理自然語言。 過去,計算語言學的研究一般由專門負責利用電腦處理自然語言的计算机科学家進行。由於近年的研究顯示人類語言...
23 KB (2,874 words) - 13:46, 14 October 2024
聊天機器人驅動的研究和對話搜索引擎,通過自然語言預測文本來回答查詢。Perplexity 於 2022 年推出,使用來自網路的資源生成答案,並在回應文本中引用連結。 Perplexity 採取增值服務模式運作;免費版本使用該公司獨立的大型語言模型(LLM),此模型包含自然語言處理(NLP)功能,而付費版本 Perplexity...
20 KB (1,616 words) - 15:38, 21 May 2025
資訊單位。對使用字母系統或音節文字等自然語言,它大約對應為一個音位、類音位的單位或符號。簡單來講就是一個漢字、假名、韓文字……,或是一個英文、其他西方語言的字母。 字符的例子有:字母、數字系統或標點符號。另外有所謂控制字符的概念,它是指:並不對應到自然語言中的某個特定符號,而是對應到語言...
4 KB (610 words) - 04:19, 6 January 2023
台灣人工智慧實驗室 (category 臺灣資訊科技公司)
语言模型技術,並利用超過1000億token的繁體中文語料進行訓練。該系統旨在提升自然語言處理的應用,並在保護用戶隱私的前提下,通過將數據保留在用戶設備上進行本地處理,避免敏感資料的傳輸。FedGPT可應用於自動化客服、文檔處理、語言...
27 KB (2,891 words) - 07:11, 23 April 2025
資訊會介入句法處理。此外,假定的語言模塊應該只會處理與語言有關的資訊(即领域特定性(英语:Domain specificity)), 然而,有證據表明,用於輔助語言的區域也介入了運動控制]和非語言的聲音理解。雖然在低於當前成像技術的分辨率下,仍可能會發生分離現象的處理...
24 KB (3,016 words) - 08:53, 5 April 2024