scratchpad模型計算Transformer任務加一個 scratchpad,就能讓 Transformer 更進一步?總結這項研究透過長加法、多項式計算和 Python 程式碼執行等多項實驗表明,令大規模預訓練語言模型從簡單的 scratchpad 中進行讀取和寫入,能夠提升其處理計算任務的效能...