我从恍惚回来,面对分开(split)的力量不可自拔的留恋起来。其实很早以前就已经看过split这则咒语了,VB Script里就含有这道咒语。却一直到今天我在Python里把一篇篇文章拆散成句子的时候才发觉这到咒语的妙用,仿佛进化成一种亮丽的魔法,悄悄一声呼唤,连亮光都来不及现身,一堆我要的句子列队空降,纪律严明。
尤其是拆解HTML tag 时,譬如:
list_P = htmlSource.split("<p>")
list_P = list_P[1:]
for i in list_P:
list_Q = i.split("</p>")
print list_Q[0]
就 这样子我得到了所有网页里(HTML Page)的段落(Paragraph)。当然split 这道魔法里头必然包含了先前我依赖已久的 strstr() 或 == 或 指标 (pointer)等等基本法运用。可是在Python的宝典里头另有高人用最优化的法术浓缩了这一系列咒语,给我们一个高级的咒语。简明又有效。
于是我何乐不为,继续用这道咒语寻找那些被标签的符号。
0 comments:
張貼留言