引言 今天帶來(lái)神作Attention Is All You Need的翻譯,該作提出了Transformer模型。很牛逼的模型像PLATO-2和GPT-3都是基于Transf...
IP屬地:河南
引言 今天帶來(lái)神作Attention Is All You Need的翻譯,該作提出了Transformer模型。很牛逼的模型像PLATO-2和GPT-3都是基于Transf...
引言 不懂?dāng)?shù)學(xué)是學(xué)不好人工智能的,本系列文章就匯總了人工智能所需的數(shù)學(xué)知識(shí)。本文是高等數(shù)學(xué)篇。 另有線代篇和概率論篇。 人工智能數(shù)學(xué)基礎(chǔ)之概率論[https://www.ji...
引言 這是李宏毅老師講的機(jī)器學(xué)習(xí)視頻中與自然語(yǔ)言處理有關(guān)的,本文主要關(guān)注Self-attention。 處理序列的模型 我們已經(jīng)知道如何處理輸入是一個(gè)向量的問(wèn)題。假設(shè)我們遇到...
前言 本文只會(huì)記錄人工智能中所用到的線性代數(shù)知識(shí),并不會(huì)記錄大學(xué)線性代數(shù)教材中的所有知識(shí)。 標(biāo)量 只有大小沒(méi)有方向的量稱為標(biāo)量。 單個(gè)數(shù)字就是標(biāo)量。 向量 所謂的向量就是一組...
概率論 基礎(chǔ)概念 隨機(jī)試驗(yàn) 試驗(yàn)是指為了觀察某事的結(jié)果或某物的性能而從事的某種活動(dòng)。在概率論中,一個(gè)試驗(yàn)如果具有以下3個(gè)特點(diǎn): 可重復(fù)性:在相同條件下可以重復(fù)進(jìn)行 可觀察性:...