前言:
由于今天面试前端,面试官问对正则表达式的匹配理解吗?
当时脑袋发热,我说就是对字符串的替换。。。。
太抽象了,于是我面试结束后马上打开力扣,解了正则表达式的匹配算法题(四种语言);
下面看题
题目:
给你一个字符串
s
和一个字符规律p
,请你来实现一个支持'.'
和'*'
的正则表达式匹配。
'.'
匹配任意单个字符'*'
匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串
s
的,而不是部分字符串。示例 1:
输入:s = "aa", p = "a" 输出:false 解释:"a" 无法匹配 "aa" 整个字符串。示例 2:
输入:s = "aa", p = "a*" 输出:true 解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。示例 3:
输入:s = "ab", p = ".*" 输出:true 解释:".*" 表示可匹配零个或多个('*')任意字符('.')。提示:
1 <= s.length <= 20
1 <= p.length <= 20
s
只包含从a-z
的小写字母。p
只包含从a-z
的小写字母,以及字符.
和*
。- 保证每次出现字符
*
时,前面都匹配到有效的字符
解题思路:
这道题可以使用动态规划来解决。我们定义一个二维数组 dp,其中 dp[i][j] 表示字符串 s 的前 i 个字符是否与正则表达式 p 的前 j 个字符匹配。
我们首先初始化 dp[0][0] 为 true,因为空字符串总是与空正则表达式匹配。然后,我们遍历正则表达式 p 中的每个字符,并更新 dp 表。
如果当前字符是 '.', 则它可以匹配任何字符,因此我们更新 dp[i][j] 为 dp[i - 1][j - 1]。
如果当前字符是 '*', 则它可以匹配前面一个字符零次或多次。因此,我们更新 dp[i][j] 为 dp[i - 1][j - 1]、dp[i][j - 1] 和 dp[i][j] 的或。
如果当前字符是其他字符,则它必须与字符串 s 中的当前字符匹配。因此,我们更新 dp[i][j] 为 dp[i - 1][j - 1]。
最后,我们返回 dp[m][n],其中 m 和 n 分别是字符串 s 和正则表达式 p 的长度。如果 dp[m][n] 为 true,则字符串 s 与正则表达式 p 匹配,否则不匹配。
代码实现:
C语言:
bool isMatch(char *s, char *p) {
int m = strlen(s);
int n = strlen(p);
bool dp[m + 1][n + 1];
memset(dp, false, sizeof(dp));
dp[0][0] = true;
for (int i = 0; i < n; i++) {
if (p[i] == '*') {
dp[0][i + 1] = dp[0][i - 1];
}
}
for (int i = 0; i < m; i++) {
for (int j = 0; j < n; j++) {
if (p[j] == '.' || p[j] == s[i]) {
dp[i + 1][j + 1] = dp[i][j];
} else if (p[j] == '*') {
if (p[j - 1] == '.' || p[j - 1] == s[i]) {
dp[i + 1][j + 1] = dp[i + 1][j - 1] || dp[i][j + 1] || dp[i][j];
} else {
dp[i + 1][j + 1] = dp[i + 1][j - 1];
}
}
}
}
return dp[m][n];
}
Python:
class Solution:
def isMatch(self, s, p):
m = len(s)
n = len(p)
dp = [[False] * (n + 1) for _ in range(m + 1)]
dp[0][0] = True
for j in range(n):
if p[j] == '*':
dp[0][j + 1] = dp[0][j - 1]
for i in range(m):
for j in range(n):
if p[j] == '.' or p[j] == s[i]:
dp[i + 1][j + 1] = dp[i][j]
elif p[j] == '*':
if p[j - 1] == '.' or p[j - 1] == s[i]:
dp[i + 1][j + 1] = dp[i + 1][j - 1] or dp[i][j + 1] or dp[i][j]
else:
dp[i + 1][j + 1] = dp[i + 1][j - 1]
return dp[m][n]
JavaScript:
/**
* @param {string} s
* @param {string} p
* @return {boolean}
*/
const isMatch = (s, p) => {
const dp = Array(s.length + 1).fill(0).map(() => Array(p.length + 1).fill(false));
dp[0][0] = true;
for (let i = 0; i < p.length; i++) {
if (p[i] === '*') {
dp[0][i + 1] = dp[0][i - 1];
}
}
for (let i = 0; i < s.length; i++) {
for (let j = 0; j < p.length; j++) {
if (p[j] === '.' || p[j] === s[i]) {
dp[i + 1][j + 1] = dp[i][j];
} else if (p[j] === '*') {
if (p[j - 1] === '.' || p[j - 1] === s[i]) {
dp[i + 1][j + 1] = dp[i + 1][j - 1] || dp[i][j + 1] || dp[i][j];
} else {
dp[i + 1][j + 1] = dp[i + 1][j - 1];
}
}
}
}
return dp[s.length][p.length];
};
Java:
class Solution {
public boolean isMatch(String s, String p) {
int m = s.length();
int n = p.length();
boolean[][] dp = new boolean[m + 1][n + 1];
dp[0][0] = true;
for (int i = 0; i < n; i++) {
if (p.charAt(i) == '*') {
dp[0][i + 1] = dp[0][i - 1];
}
}
for (int i = 0; i < m; i++) {
for (int j = 0; j < n; j++) {
if (p.charAt(j) == '.' || p.charAt(j) == s.charAt(i)) {
dp[i + 1][j + 1] = dp[i][j];
} else if (p.charAt(j) == '*') {
if (p.charAt(j - 1) == '.' || p.charAt(j - 1) == s.charAt(i)) {
dp[i + 1][j + 1] = dp[i + 1][j - 1] || dp[i][j + 1] || dp[i][j];
} else {
dp[i + 1][j + 1] = dp[i + 1][j - 1];
}
}
}
}
return dp[m][n];
}
}
可以看到,Java解出的效率是最高的
总结:
这道题考察了动态规划的思想和正则表达式的匹配规则。通过使用二维数组 dp 来记录子问题的解