1410. HTML 实体解析器
代码仓库地址: https://github.com/slience-me/Leetcode
个人博客 :https://slienceme.xyz
编写一个函数来查找字符串数组中的最长公共前缀。
如果不存在公共前缀,返回空字符串
""
。「HTML 实体解析器」 是一种特殊的解析器,它将 HTML 代码作为输入,并用字符本身替换掉所有这些特殊的字符实体。
HTML 里这些特殊字符和它们对应的字符实体包括:
- 双引号: 字符实体为
"
,对应的字符是"
。 - 单引号: 字符实体为
'
,对应的字符是'
。 - 与符号: 字符实体为
&
,对应对的字符是&
。 - 大于号: 字符实体为
>
,对应的字符是>
。 - 小于号: 字符实体为
<
,对应的字符是<
。 - 斜线号: 字符实体为
⁄
,对应的字符是/
。
给你输入字符串
text
,请你实现一个 HTML 实体解析器,返回解析器解析后的结果。示例 1:
输入:text = "& is an HTML entity but &ambassador; is not." 输出:"& is an HTML entity but &ambassador; is not." 解释:解析器把字符实体 & 用 & 替换
示例 2:
输入:text = "and I quote: "..."" 输出:"and I quote: \"...\""
示例 3:
输入:text = "Stay home! Practice on Leetcode :)" 输出:"Stay home! Practice on Leetcode :)"
示例 4:
输入:text = "x > y && x < y is always false" 输出:"x > y && x < y is always false"
示例 5:
输入:text = "leetcode.com⁄problemset⁄all" 输出:"leetcode.com/problemset/all"
提示:
1 <= text.length <= 10^5
- 字符串可能包含 256 个ASCII 字符中的任意字符。
- 双引号: 字符实体为
方案1:暴力解
第一种纯暴力解,遍历替换
执行用时分布 744ms 击败11.76%使用 C++ 的用户
消耗内存分布16.37MB 击败90.20%使用 C++ 的用户
方案2
发现没有优化太多,反而超时了
超出时间限制
测试用例通过了,但耗时太长。
方案3
最后的优化
class Solution {
public:
string entityParser(string text) {
string result = "";
int i = 0;
int n = text.length();
while (i < n) {
if (text[i] == '&') {
if (text.substr(i, 6) == """) {
result += "\"";
i += 6;
} else if (text.substr(i, 6) == "'") {
result += "'";
i += 6;
} else if (text.substr(i, 5) == "&") {
result += "&";
i += 5;
} else if (text.substr(i, 4) == ">") {
result += ">";
i += 4;
} else if (text.substr(i, 4) == "<") {
result += "<";
i += 4;
} else if (text.substr(i, 7) == "⁄") {
result += "/";
i += 7;
} else {
result += text[i];
i++;
}
} else {
result += text[i];
i++;
}
}
return result;
}
};
执行用时分布 68ms 击败80.39%使用 C++ 的用户
消耗内存分布 18.54MB 击败35.29%使用 C++ 的用户
备注:由于有的代码与编辑器冲突,所以改为图片,源代码见github
文档信息
- 本文作者:slience_me
- 本文链接:https://slienceme.xyz/2023/11/23/Leetcode_1410/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)