LeetCode:HTML 实体解析器
题目
「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
- 双引号:字符实体为
"
,对应的字符是"
。 - 单引号:字符实体为
'
,对应的字符是'
。 - 与符号:字符实体为
&
,对应对的字符是&
。 - 大于号:字符实体为
>
,对应的字符是>
。 - 小于号:字符实体为
<
,对应的字符是<
。 - 斜线号:字符实体为
⁄
,对应的字符是/
。
给你输入字符串 text
,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。
示例 1:
1 | 输入:text = "& is an HTML entity but &ambassador; is not." |
示例 2:
1 | 输入:text = "and I quote: "..."" |
示例 3:
1 | 输入:text = "Stay home! Practice on Leetcode :)" |
示例 4:
1 | 输入:text = "x > y && x < y is always false" |
示例 5:
1 | 输入:text = "leetcode.com⁄problemset⁄all" |
提示:
1 <= text.length <= 10^5
- 字符串可能包含 256 个ASCII 字符中的任意字符。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/html-entity-parser
思路
一开始以为 N 个替换就好,后来发现 &gt;
会多次转义得到结果 >
,但实际期望是 >
。所以……正则搞起……
代码
Go
1 | package main |