Playing Atari with Deep Reinforcement Learning
在之前的文章有提到Q-Networks,但卻沒有細講它的運作方式,這篇來介紹一下這曾經上過Nature的paper。
Generative Adversarial User Model for Reinforcement Learning Based Recommendation System
Reinforcement Learning很適合用在推薦系統上,然而要訓練RL需要很多跟使用者互動的經驗,這篇paper使用類似GAN的方法來去創造user model,以跟推薦系統互動。
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
這篇介紹一下常常聽到的BERT是怎麼樣運作的。
Deep contextualized word representation
這篇簡單介紹一下赫赫有名的ELMo,其源自於Deep contextualized word representation這篇paper。
52 post articles, 7 pages.