摘要: 大型语言模型 (LLM) 的快速发展为复杂工作流程的自动化开辟了新领域。本文探讨了一种利用大型语言模型 (LLM) 解析和解释 PSR.exe(一种用于捕获用户鼠标和键盘操作的工具)记录的数据来模拟计算机使用的创新方法。我们提出了一种提取、分析和复制 MHT 文件中记录的用户交互的方法。通过解码屏幕截图和提取动作序列,我们旨在开发一个自动化流程,使应用程序能够有效地模拟用户操作。该工作流结合了 BeautifulSoup(用于 XML 解析)、base64(用于图像解码)和 LLM(用于语义分析)。结果表明,我们的方法轻量级、多功能,能够确保精度和适应性,同时减少对外部跟踪工具的依赖。