Miten Lstm laskee parametrien määrän?
Miten Lstm laskee parametrien määrän?

Video: Miten Lstm laskee parametrien määrän?

Video: Miten Lstm laskee parametrien määrän?
Video: How to Make a Text Summarizer - Intro to Deep Learning #10 2024, Marraskuu
Anonim

Arvojesi mukaan siis. Kun se syötetään kaavaan, saadaan:->(n=256, m=4096), yhteensä parametrien määrä on 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. määrä painoista On 28 = 16 (yksiköiden_määrä * yksiköiden_määrä) toistuville yhteyksille + 12 (input_dim * yksiköiden lukumäärä) tulolle.

Kysyttiin myös, miten löydät parametrien määrän?

Vastaanottaja laskea opittavaa parametrit tässä meidän tarvitsee vain kertoa leveyden m, korkeuden n muodolla ja ottaa huomioon kaikki tällaiset suodattimet k. Älä unohda kunkin suodattimen bias-termiä. Parametrien määrä CONV-kerroksessa olisi: ((m * n)+1)*k), lisätty 1 kunkin suodattimen bias-termin vuoksi.

Samoin kuinka monta piilotettua yksikköä Lstm:llä on? An LSTM verkkoon. Verkossa on viisi tuloa yksiköitä , a piilotettu kerros koostuu kahdesta LSTM muistilohkot ja kolme lähtöä yksiköitä . Jokaisessa muistilohkossa on neljä tuloa, mutta vain yksi lähtö.

Tämän jälkeen voidaan myös kysyä, kuinka löydät parametrien lukumäärän RNN:stä?

1 vastaus. Entiteetit W, U ja V ovat yhteisiä kaikissa vaiheissa RNN ja nämä ovat ainoat parametrit kuvassa kuvatussa mallissa. Siten parametrien määrä opittava harjoittelun aikana = dim(W)+dim(V)+dim(U). Kysymyksen tietojen perusteella tämä = n2+kn+nm.

Kuinka monta kerrosta Lstm:ssä on?

Yleensä 2 kerroksia ovat osoittautuneet riittäviksi havaitsemaan monimutkaisempia ominaisuuksia. Lisää kerroksia voi olla parempi, mutta myös vaikeampi harjoitella. Yleisenä peukalosääntönä - 1 piilotettu kerros työskentele yksinkertaisten ongelmien kanssa, kuten tämä, ja kaksi riittää löytääksesi kohtuullisen monimutkaisia ominaisuuksia.

Suositeltava: