如何解析计算机代码，代码的出现 ay 3

PHP中文网 • 2025年2月25日 12:05:42 • 编程技术 • 阅读 3

探秘advent of code第三天的解析挑战：优雅地处理杂乱输入

最近重温Advent of Code第三天的挑战，它巧妙地提出了一个有趣的解析问题：从杂乱的输入中提取有效代码。这对于解析器和词法分析器开发来说是一次绝佳的练习。让我们一起探索解决这个问题的策略。

起初，我依赖hy进行解析。但最近对生成式AI的探索让我转向了funcparserlib库。这次挑战让我深入了解了funcparserlib的强大功能。

词法分析（分词）

处理杂乱输入的第一步是词法分析（或标记化）。词法分析器（或分词器）扫描输入字符串，将其分解成独立的标记——进一步处理的基本单元。标记代表输入中有意义的单元，并按类型分类。本题中，我们关注以下标记类型：

运算符 (op): 例如mul、do、don’t。数字: 数值，例如2、3。逗号: ,，参数分隔符。括号: (和)，定义函数调用结构。乱码: 与其他类型不匹配的字符或字符序列。

我摒弃了funcparserlib教程中常见的“魔术字符串”方法，转而采用更结构化的枚举定义：

from enum import Enum, autoclass TokenSpec(Enum):    OP = auto()    NUMBER = auto()    COMMA = auto()    LPAREN = auto()    RPAREN = auto()    GIBBERISH = auto()

登录后复制

使用TokenSpec.OP、TokenSpec.NUMBER等，提高了代码可读性、可维护性和类型安全性。

为了与funcparserlib集成，我创建了一个名为tokenspec_的装饰器，它包装了funcparserlib的tokenspec函数，简化了标记定义：

from funcparserlib.lexer import tokenspecdef tokenspec_(spec: TokenSpec, *args, **kwargs):    return tokenspec(spec.name, *args, **kwargs)

登录后复制

利用tokenspec_，我们可以定义分词器：

from funcparserlib.lexer import make_tokenizerdef tokenize(input_str: str):    tokenizer = make_tokenizer([        tokenspec_(TokenSpec.OP, r"mul(?=(d{1,3},d{1,3}))|do(?=())|don't(?=())"),        tokenspec_(TokenSpec.NUMBER, r"d{1,3}"),        tokenspec_(TokenSpec.LPAREN, r"("),        tokenspec_(TokenSpec.RPAREN, r")"),        tokenspec_(TokenSpec.COMMA, r","),        tokenspec_(TokenSpec.GIBBERISH, r".")  #匹配任何字符    ])    return tuple(token for token in tokenizer(input_str) if token.type != TokenSpec.GIBBERISH.name)

登录后复制

mul的正则表达式使用前瞻断言确保正确的语法。

tokenize函数过滤掉乱码标记。

解析器实现

tokenize返回的标记序列将被送入解析器。为了简化解析器定义，我创建了tok_装饰器：

from funcparserlib.parser import tokdef tok_(spec: TokenSpec, *args, **kwargs):    return tok(spec.name, *args, **kwargs)

登录后复制

数字解析器：

number = tok_(TokenSpec.NUMBER) >> int

登录后复制

解析规则：

from dataclasses import dataclassfrom abc import ABC, abstractmethodclass Expr(ABC):    @abstractmethod    def evaluate(self) -> int:        pass@dataclassclass Mul(Expr):    alpha: int    beta: int    def evaluate(self) -> int:        return self.alpha * self.beta@dataclassclass Condition(Expr):    can_proceed: bool    def evaluate(self) -> int:        return 0 #条件表达式不参与计算mul = (tok_(TokenSpec.OP, "mul") + tok_(TokenSpec.LPAREN) + number + tok_(TokenSpec.COMMA) + number + tok_(TokenSpec.RPAREN)) >> (lambda t: Mul(t[2], t[4]))do = (tok_(TokenSpec.OP, "do") + tok_(TokenSpec.LPAREN) + tok_(TokenSpec.RPAREN)) >> (lambda _: Condition(True))dont = (tok_(TokenSpec.OP, "don't") + tok_(TokenSpec.LPAREN) + tok_(TokenSpec.RPAREN)) >> (lambda _: Condition(False))expr = mul | do | dontfrom funcparserlib.parser import finished, manyimport operatorcall = many(tok_(TokenSpec.NUMBER) | tok_(TokenSpec.LPAREN) | tok_(TokenSpec.RPAREN) | tok_(TokenSpec.COMMA)) + expr + many(tok_(TokenSpec.NUMBER) | tok_(TokenSpec.LPAREN) | tok_(TokenSpec.RPAREN) | tok_(TokenSpec.COMMA)) >> operator.itemgetter(1)program = many(call) + finished >> (lambda t: tuple(t[0]))def parse(tokens):    return program.parse(tokens)

登录后复制

难题求解

第一部分：

def part1(input_str: str) -> int:    expressions = parse(tokenize(input_str.strip()))    return sum(expr.evaluate() for expr in expressions if isinstance(expr, Mul))

登录后复制

第二部分：

def part2(input_str: str) -> int:    expressions = parse(tokenize(input_str.strip()))    can_proceed = True    total = 0    for expr in expressions:        if isinstance(expr, Condition):            can_proceed = expr.can_proceed        elif isinstance(expr, Mul):            if can_proceed:                total += expr.evaluate()    return total

登录后复制

迭代改进

最初，我的方法涉及两次解析。现在，单次解析就完成了所有任务，提高了效率。

这次Advent of Code之旅让我巩固了词法分析和解析的知识。期待未来更复杂的挑战！

以上就是如何解析计算机代码，代码的出现 ay 3的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2173733.html

2025 AI Python 代码可读性

0 0

关于作者

PHP中文网签约作者

558.0K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

使用 HTMX 和 Django 创建待办事项应用程序，部分无限滚动

上一篇 2025年2月25日 12:05:34

5 年内即可学习的最佳开发堆栈

下一篇 2025年2月25日 12:05:49

编程技术

BitMEX交易所官方网站登录最新入口

登录 bitmex 官方网站的过程：访问官方网站点击右上角的“登录”按钮输入电子邮件或手机号码和密码完成双重身份验证（如果已启用） 2025 全球主流币交易所官网登录入口欧易okx入口：币安binance入口：gate.io入口： Bit…

PHP中文网
2025年4月5日
1000
BOE（京东方）绵阳“零碳工厂”探访活动圆满落幕树立显示产业绿色转型新标杆

京东方绵阳“零碳工厂”：绿色制造的行业典范 2025年3月13日，京东方在绵阳成功举办“零碳工厂”探访活动，邀请行业KOL和媒体代表参观其第六代柔性AMOLED生产线——国内首个“零碳工厂”。活动全方位展示了京东方在绿色制造领域的突出成就，…

PHP中文网
2025年4月5日 • 编程技术
2000
电子包浆生成器入口在哪里-电子包浆生成器入口在线制作2025最新分享

还在寻找电子包浆生成器？本文提供2025最新在线制作入口及使用方法，助您轻松制作个性化表情包！电子包浆生成器在线制作入口： https://www.php.cn/link/8d297a658bd8918ca2428789005950df …

PHP中文网
2025年4月5日 • 编程技术
2000
《符文工房龙之天地》角色介绍影片村雨与丽日篇

《符文工房：龙之天地》新角色及游戏情报公开！备受期待的《符文工房》系列最新作《符文工房：龙之天地》将于2025年5月30日（周五）登陆Nintendo Switch™和Steam®平台！官方近日公布了更多游戏细节，包括新角色介绍影片以及游…

PHP中文网
2025年4月5日 • 编程技术
2000
《孤星猎人》将结束抢先体验4月3日推出正式版

策略肉鸽游戏《孤星猎人》4月3日正式登陆steam、epic及switch！官方消息，《孤星猎人》将于2025年4月3日正式结束抢先体验，登陆Steam、Epic游戏商城和Nintendo Switch平台，Switch eShop现已开…

PHP中文网
2025年4月5日 • 编程技术
2000
恋爱模拟游戏《永夏之恋》Steam页面上线年内发售

恋爱模拟游戏《永夏之恋》steam页面正式上线，预计2025年发售！点击此处前往steam商店页面了解更多：https://www.php.cn/link/7ed94938c403c962c1798fe420759807 游戏简介：重拾儿…

PHP中文网
2025年4月5日 • 编程技术
1000
编程技术

北理工团队在Nature子刊发表评述性论文

北京理工大学学者在《nature nanotechnology》和《nature materials》发表评述文章，解读最新二维材料研究成果。北京理工大学姚裕贵教授和段嘉华教授在《Nature Nanotechnology》发表评述文章，…

PHP中文网
2025年4月5日
2000
《RO 仙境传说：守护永恒的爱 Classic》付费删档测试启动释出来自制作人的一封信

《ro仙境传说：守护永恒的爱classic》删档测试开启！重温经典ro的纯粹乐趣！ Gravity Interactive于3月12日正式启动《RO仙境传说：守护永恒的爱Classic》（简称《RO：守爱Classic》）删档测试（CBT）…

PHP中文网
2025年4月5日 • 编程技术
2000
双摇杆射击动作RPG《Look Mum No Computer》Steam页面开放 2025年发行

双摇杆射击动作rpg《look mum no computer》现已登陆steam平台！预计年内发售，敬请期待！目前暂不支持中文。点击此处前往steam商店页面：https://www.php.cn/link/851d6b8d0d06786…

PHP中文网
2025年4月5日 • 编程技术
2000
顺络电子诚邀新老客户参加美国2025 APEC（应用能源电子）展会

2025 apec 展会：顺络电子精彩亮相展会信息：展位号: 545时间: 2025年3月16日（周日）-20日（周四）（当地时间）地点: 美国乔治亚州亚特兰大乔治亚世界会议中心 (Georgia World Congress Cent…

PHP中文网
2025年4月5日 • 编程技术
1000

发表回复

登录后才能评论

如何解析计算机代码，代码的出现 ay 3

词法分析（分词）

解析器实现

难题求解

迭代改进

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

AD推荐黄金广告位招租... 更多推荐