前端 / regex
Medium

正则表达式

一位观众发送了垃圾弹幕,这是他的大脑发生的变化。

正则

在这个充满创意的弹幕与低质量弹幕并存的世界里,我们需要你的智慧来拯救观众的眼睛。今天,我们就要对那些令人头疼的弹幕格式进行清洗。快来挑战你的正则表达式技能,帮助我们打造一个更美好的观影体验吧!

你需要针对以下几种情况,写出能命中这些弹幕的正则表达式(JavaScript 正则),并尽可能减少误伤。

#格式说明示例弹幕
1把 X 打在公屏/屏幕上谢邀,不打。
  • 大家把“保护”打在公屏上!
2哈哈……超过两个字,且从头到尾都是同一个字符。
  • 哈哈哈哈哈哈哈哈哈
  • 666666
3第 X
  • “第”还可能是“前”,以及错别字“低”“底”“地”“弟”;
  • X 可能是汉字或阿拉伯数字;
  • 后面可能有各种标点符号,包括中英文标点。
  • 第一!
  • 前100。。。
4X 分钟前
  • X 可能是汉字或阿拉伯数字;
  • “分钟”还可能是“小时”“分”“秒”等时间单位;
  • “前”可能省略;
  • 后面可能跟一堆标点符号。
  • 10秒前
  • 一分钟前!!

你还遇到过什么需要用正则屏蔽的弹幕吗?欢迎分享。


附录

正则表达式在线测试工具:Regex101

plaintext
大家把“保护”打在公屏上!
哈哈哈哈哈哈哈哈哈
666666
第一!
前100。。。
10秒前
一分钟前!!
1s前
供复制的示例弹幕
出题人:Hanny