现在又一个十几万个基因的名字,需要在一段文字中找到这些基因 Gene Symbol,然后从这个 Gene Symbol 两边切一刀,把这段文字切成 list
但是这个 pattern 就会操集长,想到用 re.split 来弄,但是 pattern 太长了,效率低