<div style="min-height:22px;margin-bottom:8px;">Hi Adapters,</div><div style="min-height:22px;margin-bottom:8px;"><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">This time I'm going to talk about Reinforcement Learning with policy gradient. I'll first introduce the overall Neural  Network structure in RL with PG, and then I'll give you a brief introduction about how to apply RL in text generation.</div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">There is an excellent blog about RL with PG written by Karpathy:</div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><a dir="ltr" href="http://karpathy.github.io/2016/05/31/rl/" isadd="1" style="-webkit-text-size-adjust: auto; background-color: rgba(255, 255, 255, 0);" x-apple-data-detectors="true" x-apple-data-detectors-result="0" x-apple-data-detectors-type="link"><font color="#000000">http://karpathy.github.io/2016/05/31/rl/</font></a></div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">And the paper involved this time is here:</div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><a dir="ltr" href="https://arxiv.org/pdf/1511.06732.pdf" isadd="1" style="-webkit-text-size-adjust: auto; background-color: rgba(255, 255, 255, 0);" x-apple-data-detectors="true" x-apple-data-detectors-result="1" x-apple-data-detectors-type="link"><font color="#000000">https://arxiv.org/pdf/1511.06732.pdf</font></a></div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">Have a nice day! :)</div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">Time: <a dir="ltr" isadd="1" style="-webkit-touch-callout: none;" x-apple-data-detectors="true" x-apple-data-detectors-result="2" x-apple-data-detectors-type="calendar-event">Wed 4:30 pm</a></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">Venue: Room 3-517 </div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div><div class=" selfdiv" style="width: auto !important; height: auto !important;">See you then,</div><div class=" selfdiv" style="width: auto !important; height: auto !important;">Kelsey</div><div class=" selfdiv" style="width: auto !important; height: auto !important;"><br></div></div><span class="mail-footer">·¢×ÔÎÒµÄiPhone</span><div id="original-content"></div>