Kineski MemRL donosi pamćenje LLM agentima bez skupog treniranja
MemRL uvodi epizodno pamćenje i Q-vrijednosti u rad velikih jezičnih modela, omogućujući im da se prilagođavaju novim zadacima bez ponovnog treniranja i pritom nadmaše klasične RAG sustave.