2V1G 一些电脑 一些科学 一張照片的誕生 九把刀 人物 十字路口 大城小鎮 小小說 小孩 小旅行 马鲁帝 书本 公園 分享 友人 天空 太魯閣 日本 日偏食 水果 水痘 火车 出游 发生过的 古典樂 台灣 札记 生日 生活 生活,照片 生活方式 生活点滴 生病 电影 买书 亚庇 交通 关丹 吉隆坡 回/记忆 回和记忆 地震 早餐 有机 有孩子的人 有機 羽毛球 耳机 艾西莫夫 住海邊 体育 听歌 希腊 我居住的地方 我家小孩 村上春樹 步行 沙巴 谷中城 豆原 車站 那些我爱过的女孩们 事件 京都 卷雲 咖啡 咖啡館 国家公园 怡保 房子 拍摄婚礼 明信片 治安 法国电影 社会 花蓮 花蓮慢游 转贴 金马仑 陈绮贞 星巴克 星空 星軌 相片 相机 相機 相簿 省思 省思 thought 看电影 科幻 科技 紅葉 若干心事 苹果 郊游 郊遊 面包 音乐空间 音樂 食物 哥本哈根 家鄉 恩田陆 旅游 旅遊 晃蕩 書本 書本,閱讀 烟火 烟雾 神山 阅读 阅读笔记 馬六甲 馬拉松 健康 婚礼 婚禮 婚禮攝影 教育 清明 理发 琐事 荷蘭 設計 野餐 雪山 散文 森林 渡轮 等待 编程 感性一点 感恩 摄影 新加坡 新闻 椰子屋 照片 過年 電影 榴槤 演唱会 静思书轩 寫詩 閱讀 閱讀,書本 閱讀筆記 閱讀筆記,閱讀,書本 器材 澳門 辩论 镜头 餐厅 餐廳 講座 點滴 檳城 瀑布 藍山 藝術 關丹 籃球 攝影 聽歌 ABL apple art badminton basketball blue mountain book bread breakfast bukit tinggi cafe camera cameron cheers cherating classical coffee concert copenhagen denmark design diary durian eclipse fairtrade feeling firework food friend fruit full-frame gadget GRD GRD2 greece happen haruki murakami hometown house hualien incident interior ipoh jandabaik japan jeram toi jogging kelantan KTM kuala lumpur kuantan kundasang kyoto langkawi lens life living style Macau marudi melaka memory miangkam midvalley mossy forest movie mt kinabalu music musicstory nba netherland new year organic panasonic G1 park pasir belanda penang people perhentian photo photography picnic poem portrait postcard prewedding programming reading restaurant rimbun dahan running science sentimental sggabai sharing shopping sick singapore sports star trait starbuck story stroget taiwan technology thought thoughts thoughts.省思 titi eco farm travel trip typica wangsa maju waterfall wedding

Split

分开其实是另一种合成,一栋栋不同功能的建筑物分开放在土地的不同角落,合成了城市。恋人分开形体,合成了思念。我把文章分开来,合成了藕断丝连的句子, 再进一步把句子分开来,一地散落的物体(noun)和动作(verb),我端详了好久,合成是一则失传的故事,隐隐约约自凌乱的文字尸体间传来一阵笑声。
我从恍惚回来,面对分开(split)的力量不可自拔的留恋起来。其实很早以前就已经看过split这则咒语了,VB Script里就含有这道咒语。却一直到今天我在Python里把一篇篇文章拆散成句子的时候才发觉这到咒语的妙用,仿佛进化成一种亮丽的魔法,悄悄一声呼唤,连亮光都来不及现身,一堆我要的句子列队空降,纪律严明。
尤其是拆解HTML tag 时,譬如:

list_P = htmlSource.split("<p>")
list_P = list_P[1:]
for i in list_P:
list_Q = i.split("</p>")
print list_Q[0]


就 这样子我得到了所有网页里(HTML Page)的段落(Paragraph)。当然split 这道魔法里头必然包含了先前我依赖已久的 strstr() 或 == 或 指标 (pointer)等等基本法运用。可是在Python的宝典里头另有高人用最优化的法术浓缩了这一系列咒语,给我们一个高级的咒语。简明又有效。
于是我何乐不为,继续用这道咒语寻找那些被标签的符号。


0 comments:







Creative Commons License
This work by fox is licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 United States License.