要看你講的是什么代碼。像我們做數(shù)據(jù)分析的話,用R寫數(shù)據(jù)分析也是代碼,這個(gè)有很多年了。但是要和社交媒體相關(guān)的話,差不多我來這邊工作第一年就開始學(xué),當(dāng)時(shí)是為了寫Information, Communication Society那個(gè)文章[1]而開始學(xué)習(xí)。寫Python代碼就是為了研究微博和中國集體行動(dòng)兩者關(guān)系這個(gè)問題,當(dāng)時(shí)把用戶的微博抓取下來以后,建構(gòu)一個(gè)社會(huì)網(wǎng)絡(luò),再做社會(huì)網(wǎng)絡(luò)分析。我當(dāng)時(shí)也是基本上從零開始學(xué)語言,收集線上數(shù)據(jù),有大半個(gè)學(xué)期集中學(xué)了一下。
學(xué)代碼的過程總歸是越來越容易。很多時(shí)候,所有的編程都有類似一個(gè)思路,只是句法不一樣,所以如果你學(xué)過編程,對(duì)整個(gè)編程有一個(gè)整體的了解。然后你再來寫這個(gè)代碼就會(huì)簡(jiǎn)單很多,所以基本上說,學(xué)語言這個(gè)東西,開始學(xué)總歸是痛苦的。越學(xué)越簡(jiǎn)單。
引擎:其實(shí)像這種技術(shù)或者代碼應(yīng)用現(xiàn)在越來越廣了,但是本科教育階段我們不是很強(qiáng)調(diào)這方面的,你是怎么看這個(gè)現(xiàn)象和學(xué)習(xí)代碼的意義?不同學(xué)科有它的分工,所有的學(xué)科都教寫代碼也不現(xiàn)實(shí)。但從另一個(gè)角度來說,現(xiàn)在社交媒體這么發(fā)達(dá),編程本身非常重要,那么學(xué)習(xí)也就很重要。不管未來從事研究工作還是就業(yè),都非常鼓勵(lì)大家學(xué)一點(diǎn)相關(guān)的技能,這種技能對(duì)未來發(fā)展可能也很重要。我們?cè)谙聜€(gè)學(xué)期我們會(huì)開一個(gè)“互聯(lián)網(wǎng)與社會(huì)”的課,下學(xué)期會(huì)增加一些跟編程有關(guān)的,比如自然語言處理,非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)分析等等,社會(huì)網(wǎng)絡(luò)分析可能會(huì)涉及到。
增加這些內(nèi)容的意義是什么?第一,如果你要研究這個(gè)社交媒體的話,這個(gè)是繞不開的。第二個(gè)也是非常鼓勵(lì)我們的學(xué)生去學(xué)習(xí)代碼。隨著外部社會(huì)環(huán)境變化的時(shí)候,我們的研究對(duì)象和研究的手段工具都需要跟著變化。雖然我們也不知道以后會(huì)發(fā)展什么樣,但是我們需要往這個(gè)方面去探索,可能有一天,這樣一種基于文本的分析會(huì)成為社會(huì)科學(xué)的一個(gè)很重要研究路徑。如果那時(shí)候零基礎(chǔ)零準(zhǔn)備的話,那我們就會(huì)落后源碼,所以我們現(xiàn)在是先做起來。當(dāng)然,基于大數(shù)據(jù)和社交媒體的研究也可能是一個(gè)“不歸之路”。但是不管怎樣,我還是愿意用一個(gè)更加積極的角度來看,所以我們先做好準(zhǔn)備。
第三個(gè)方面的考慮,有關(guān)互聯(lián)網(wǎng)的問題現(xiàn)在也會(huì)有很多計(jì)算機(jī)學(xué)科背景的人來做。我們最近在開全國社會(huì)媒體處理大會(huì)(Social Media Processing,下簡(jiǎn)稱SMP),跟計(jì)算機(jī)的一些同仁去交流經(jīng)驗(yàn)。我們會(huì)發(fā)現(xiàn)他們?cè)诩夹g(shù)上非常成熟,但是他們的技術(shù)用來解決我們社會(huì)科學(xué),或者社會(huì)學(xué)的一些問題的話,還是蠻大的缺口(gap)。這個(gè)缺口在于源碼,我們做社會(huì)學(xué)的和他們所關(guān)心的問題互不相同。我們直接把我們的問題提出來,要他們處理,他們現(xiàn)有的工具是處理不了的。但是他們會(huì)跟你說,他們的東西如果根據(jù)研究問題做一些調(diào)整,可能能用。所以問題就在于說,如果我們不參與,不交流他們永遠(yuǎn)不會(huì)做這個(gè)調(diào)整。
比如,他們?cè)谧鲆恍┣楦蟹治龅臅r(shí)候會(huì)做一些正情感,負(fù)情感,好評(píng)、差評(píng)的評(píng)估。如果你在商業(yè)應(yīng)用里面,比如這個(gè)餐館是好評(píng)還是差評(píng),算一下評(píng)論多少好評(píng)就夠了,但對(duì)我們來說,其實(shí)問題要更復(fù)雜。比如現(xiàn)在我們要研究一個(gè)政治態(tài)度,有多少是民族主義,多少民粹主義,多少是愛國主義,有多少是打醬油的。你會(huì)發(fā)現(xiàn),這樣的一個(gè)東西,粗粗聽上去跟他們正負(fù)蠻類似的,但是你就是找不到一些最起碼中文上現(xiàn)有的工具直接拿來可以用。
所以我們也希望在技術(shù)這個(gè)方面一定要有一些社會(huì)科學(xué)的人參與進(jìn)來,看看理工科有哪些工具,做到什么程度?有哪些是不能做,我們更好地跟他們交流,說我們覺得哪些東西做好,哪些東西是我們想要的技術(shù)研發(fā)上還沒有提供。通過這個(gè)交流的話,我們希望能夠促進(jìn)這個(gè)交叉學(xué)科。也是為以后有更多,能夠成為現(xiàn)成的工具包能發(fā)展出來。所以必須有這樣的人去做這樣的事。