大數據時代數據的特點范文

時間:2023-12-28 17:49:53

導語:如何才能寫好一篇大數據時代數據的特點,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

大數據時代數據的特點

篇1

關鍵詞 影視剪輯;藝術;思維;創新

中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2016)176-0013-01

1 大數據時代的影視剪輯

與傳統媒體時代相比,大數據時代影視剪輯藝術的生存環境和條件發生了“質”的變化。

首先,受眾的需求和品味發生了重大變化。隨著社會經濟發展,人們在滿足了基本的物質需求之后,對精神需求逐漸增多,特別是在現代科技日新月異的今天,精神文化產品也日新月異,導致受眾的需求越來越高,口味越來越挑剔,對影視的文化性、藝術性提出了更高層次的要求。這就要求影視剪輯工作人員要深刻把握社會上新的消費需求,認真做好市場調研,緊跟形勢變化發展,引領大眾精神消費時尚。再次,影視的價值和市場環境發生了根本性變化。當今的影視作品已經不僅僅是一種文化藝術品,也是一種商品。在市場經濟環境中生存,影視作品已逐步變成了流水線一般制造的產品,從劇本創作、演員培養培訓、拍攝場地、服裝道具等,影視剪輯只是其中的一個環節,但卻是舉足輕重的一個環節。一方面要實現編劇理想的效果,要實現導演的意圖,另一方面影視剪輯是觀眾的人,要站在受眾的角度實現受的需求。因此,當今影視剪輯需要提高眼界和格局,站在更高更遠的角度,縱觀全局考慮問題,既要考慮影視作品的藝術性,又要考慮其經濟性,只有恰到好處,達到最大性價比,才能確保影視作品的生命力。

2 大數據時代影視剪輯的藝術特點

一是大量先進科技的運用,極大增強了影視剪輯的效率、效果和效益。科技進步從硬件和軟件兩個方面極大地解放了影視剪輯的生產力,促進了剪輯效率的提高和經濟效益的提升。硬件上,傳統的影視剪輯其實是“影視剪接”。經過拍攝獲得底片,經過沖洗底片獲得原始的樣片,然后剪輯師用剪刀對樣片進行碎片式剪接,按照原來設計的故事情節,用膠水膠帶對底片重新拼接,在剪輯臺上實現預覽,并逐步調整優化。由于處理工藝粗糙,無法實現對底片的精確剪切和拼接,難免出現畫面重復、抖動,顯得雜亂無章,而且磨損嚴重,影片質量不高。計算機逐步普及應用后,非線性編輯技術迅速推廣,影視剪輯行業迎來了春天。這種技術徹底告別了剪刀和膠帶式的加工方法,用鼠標和鍵盤進行操作,既簡單靈活、精確度高,又可以實現回放,還可以避免對底片素材的損傷。科技發展到現在,影視剪輯不但可以實現數字存儲,對拍攝素材進行無限次、重復性的任意剪切、拼接,還可以增加特效。與此同時,現代科技進步還促進了影視剪輯藝術的理論進步,特別是蒙太奇語言。利用計算機技術、多媒體技術、影視制作相結合,創造出了當今世界上最先進的視音頻非線性編輯技術,使畫面、聲音、字幕、特效等元素更合力、更高效、更科學地編輯組合,推動了影視創作的現代化進程。

二是表現形式上,更加追究視覺沖擊力和畫面感染力。從受眾的角度看,影視傳遞的信息要通過兩種渠道實現,一是影片本身的內容,也就是影片的故事、人物、情節、主題思想等;另一個就是影片的包裝形式和表現形式,例如現場環境、色彩、服裝服飾、道具、聲音、鏡頭組合切換等。因此,現在影視作品不但傳達基本的主題思想,更追求形式包裝,給觀眾美的享受。通過加快縮短鏡頭出現的時長,加快播放節奏,制造出緊張氣氛。例如成龍的影片《警察故事》,在警察與犯罪嫌疑人打斗的場面,雙方你來我往,打斗十分激烈。站位切換:車前與車后、室內與室外;動作切換:拔槍與開槍、踢腳與出拳;光線切換:亮光處與黑暗處……剪輯師幾乎會平均分配鏡頭的時長,讓矛盾的雙方快速交替出現,增強現場效果。通過對某一個鏡頭的從不同角度的快放、慢放、回放等剪輯,強調這一動作所展示出的人物的精氣神。例如李連杰主演的《黃飛鴻之壯志凌云》,其間多次對其經典動作佛山無影腳進行特寫,不但突出了動作的鏗鏘有力,而且展示了主人公充滿正義、不屈不撓的正面形象,特別是在剪輯時配以《男兒當自強》的背景音樂,成功營造了慷慨悲壯、自強不息的氛圍,實現了與觀眾的情感共鳴。

三是剪輯的思維更開放、更時尚、更包容、更大膽。編劇是主觀的,根據自己的想象,虛構了故事發生的環境、人物、情節;導演也是主觀的,他要了解劇本表達的主題和思想,指導演員和劇組人員進行現場創作,既會受到演員狀態、現場環境等影響,也會激發現場靈感,把自己的主觀意志加入影片中,從而對影片呈現的效果產生一定影響。剪輯師則處于比較客觀、中立的地位,既沒有編劇的主觀想象,也沒有受到導演現場環境氣氛的影響,所以能夠從受眾的角度出發去排列組合鏡頭,相當于藝術的再創造。大數據時代 的剪輯師,深受網絡文化的影響,年輕人喜歡的快節奏、激烈沖突、鮮明對比等,都運用在影視剪輯中,讓影片內容多元化。例如,電影《瘋狂的石頭》中,打破傳統一個畫面單個鏡頭的慣例,將電話兩端通話的當事人同時剪拼在一個畫面中,讓觀眾通過兩個人不同的語氣、神態、動作等顯著對比,感受不同角色豐富的內心世界。在影片結尾處,包世宏如何被道哥搶,而道哥又把要來打包世宏的小青年車門給撞飛了,道哥的摩托車撞到一直停在路邊的寶馬車上又歪打正著,解救了一直被困在下水道井蓋下的黑皮……通過這種巧妙的搭接式反復剪輯讓受眾感受到了現場激烈的人物沖突,引導受眾進入角色狀態,從而完成情感傳達與交流。

3 大數據時代影視剪輯的發展

電視剪輯未來發展的基礎是“以人為本”。著名的電影心理學家雨果?閔斯特堡曾經說過“影戲服從于心里的法則而不是外部世界”。這句名言道出了影視創作的指導原則,這也是影視剪輯未來發展的重要基礎。現代化科技可以讓影視剪輯更加快捷、高效,3D動畫、虛擬現實等可以提高畫面沖擊力,鏡頭節奏、角度以及順序調整優化等能夠增加受眾的體驗感與參與度,但是這一切必須以人為本,必須以影視的主題情感為基礎,因為影視是特殊的精神文化產品。與過去受眾被動接受影視內容不同,現在的受眾具有強烈的主觀能動性,他們會根據環境變化、人物關系去主觀推斷、臆想影視情節,主動與劇中的人物角色進行心靈對話。影視剪輯工作人員要從受眾的感知規律和欣賞心理出發,對影片聲畫素材所反映出的多種信息進行藝術化控制和加工;要充分借鑒不同類型的優秀影片成功的剪輯經驗,吸收并轉化為剪輯藝術創作的技能,并借助大數據、云計算等手段,從而不斷提升綜合實力,促進影視剪輯藝術的發展。

綜上所述,作為一門陪伴影視事業成長的藝術――影視剪輯,在大數據時代面臨著前所未有的機遇與挑戰,現代科技、新鮮理念、時尚風潮等為影視剪輯注入了新活力、新動力,高品位、多元化、差異化等趨勢也給影視剪輯帶來了風險和挑戰,只要擁抱變革的時代,讓剪輯藝術思維與時俱進,剪輯技術日新月異,牢牢把握影視創作的規律,就一定能夠在大數據時代開創影視剪輯藝術的藍海。

參考文獻

[1]鄧康.影視剪輯的藝術研究[J].西部廣播電視,2013(21):66-67.

[2]高子倫.影視后期制作在中國的現狀及發展[J].理論界,2011(7):225-226.

篇2

關鍵詞:大數據;統計學;教學改革

中圖分類號:C829.29 文獻識別碼:A 文章編號:1001-828X(2015)024-000-01

一、引言

最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。大數據具有以下的鮮明特點:第一個特征是數據量大。第二個特征是數據類型繁多,多類型的數據對數據的處理能力提出了更高的要求。第三個特征是數據價值密度相對較低,如何通過強大的機器算法更迅速地完成數據的價值“提純”,是大數據時代亟待解決的難題。第四個特征是處理速度快,時效性要求高,這是大數據區分于傳統數據挖掘最顯著的特征。

統計學專業是與數據分析處理聯系最為緊密的學科之一。大數據時代的到來不僅為統計學專業的發展帶來的前所未有的機遇,同時也帶來了巨大挑戰。傳統的統計學專業已不再適應大數據時代的信息爆發式增長的要求,這就要求我們應該對統計學專業進行重新定位,并在此基礎上調整相關課程,改革傳統的教學手段以及完善教學評價體系,以適應大數據時代的到來。

二、統計學專業改革的建議

(一)人才培養目標的重新定位

如果說以往的統計學專業是以培養簡單的“應用型”人才為目標,那么隨著大數據時代的到來,社會不僅僅需要會應用基礎統計知識處理相關領域的問題的單一的應用型人才,而是對人才提出了更高的要求:大數據時代下的統計學專業的人才除了應該具備基礎的數據收集,處理和分析的能力之外,還應該了解相關應用領域的背景知識,而且應具備很強的自我學習能力,以適應大數據時代數據量大,總類繁多,時效性高等發展特點。因此,統計學人才培養目標應該重新作出調整,應該以培養全新的“復合型”統計人才為新的目標。

(二)課程設置的調整

隨著人才培養目標的重新定位,隨之而來的就是應該對不再適應時展要求的課程進行必要的調整。

首先,大數據的分析和處理與以往的經典分析方法有很大不同,以往的統計分析方法主要是建立在抽樣基礎之上,而大數據時代信息處理迅速,信息獲得途徑廣泛,而且信息價值密度低,這就要求數據處理時,可以以全體作為樣本,而不是進行抽樣;分析時必須考慮所有數據而不是剔除所謂的異常數據。因此,以往的經典統計分析方法已不再適應大數據的處理和分析,必須適當的調整經典分析方法的課程設置,增加新的適用于大數據分析的課程。

其次,隨著數據量的爆發式增長,所有的統計工作對計算機的依賴程度越來越高,這就要求統計學專業的學生不僅掌握統計學專業的基礎知識,同時應該熟練掌握計算機專業知識相關知識,因此,在課程安排時,應注意計算機相關課程的適當增加。

基于上述原因,可以考慮增加如下課程:機器學習,模擬算法,數據挖掘,R語言軟件分析等課程,同時適當降低傳統分析方法課程的學時比重。此外,為了使學生能夠對相關應用領域的背景知識有所了解,可適當增設與應用領域相關的通識課程。

(三)教學模式與手段的創新

以往的教學模式,通常是以課堂教學,掌握書本經典理論為主。雖然,傳統教學手段有著學生理論基礎扎實等諸多優點,但是同時也存才學生過于偏重理論知識的掌握,動手能力不足,理論與實踐脫節等缺點。隨著社會的發展,尤其統計學專業自身具有鮮明的應用專業特點。只采用傳統的教學模式和手段顯然不再適合大數據時代的需要;同時,隨著大數據時代的到來,多媒體手段日益豐富多彩,為傳統教學的創新提供了必要的支持。因此,為了適應大數據時代人才的要求,必須改革傳統的教學手段和模式,在傳統教學基礎上,加大實驗教學的比重,在傳統教學外,增加社會實踐環節,引入微課慕課,翻轉課堂等全新教學模式,以提高學生的學習興趣,鍛煉學生理論應用于實踐的能力,從而為以后使用大數據時代的工作打下堅實的基礎。

(四)教學評價體系的完善

傳統的教學評價體系,通常是采用書面考核的方式對學生的學習進行評價,隨著時代的發著,單純的筆試評價不足以衡量學生的全面能力,最后導致出現高分低能的情況的出現。

為了適應大數據時代對人才多方面能力的需求,必須對傳統的考核評價體系做出適當的調整,以評價學生的多方面能力,尤其是動手能力,學習能力和應用相關理論處理實際問題的能力。具體可以采用多種考核方法相結合的方式。如:增加平時的考核力度,增加實踐項目的考核,通過布置適當的項目論文,采用答辯的形式,以鍛煉學生適應以后工作,獨立分析解決問題的能力。

此外,傳統教學評價體系通常是單方面的,只有對學生成績的評價,為了適應大數據時代的到來,全面提高教學質量,可采取雙向教學評價體系,如:增加學生對教學環節的評價體系。以及教師間同行間的評價體系等。

篇3

關鍵詞:企業管理 大數據 應用 價值 探究

中圖分類號:F270.7 文獻標識碼:A

文章編號:1004-4914(2016)10-274-02

一、前言

企業想要在激烈的市場競爭之中獲取良好的經濟效益和社會效益,需要不斷加強企業管理的相關工作,提升自身內部管理的水平和質量。當前互聯網和移動通信技術在不斷地創新和進步當中,這對于人們的生活方式、交流方式、興趣愛好等產生了較為直接的影響,主要體現在人們生活逐漸走上網絡化和數據化的道路。數據信息的爆炸式發展,促使現如今的世界步入大數據時代。在這種時代背景之下,企業的決策和經營活動,都會受到數據的影響,數據已經逐漸成為了當前企業可持續發展的重要戰略資源。只有對大數據的積極作用進行有效發揮,才能夠逐漸增強企業的核心競爭力。

二、大數據的內涵

大數據在當前實踐領域和學術領域中受到了越來越高的重視,對大數據進行全面有效的研究和分析,能夠為社會進步和發展提供良好的前提條件,人們在這一點上已經逐步達成了共識。大數據主要是指數據信息十分龐大繁雜,需要使用云計算等數據挖掘技術才能夠對數據信息進行深度的挖掘,由此獲取到具有高潛在價值的巨量資料。大數據具有較高的潛藏價值,并且數據量本身就較為龐大,具有一定的復雜性,這就需要企業在進行數據信息的處理過程中,需要有更高的能力進行挖掘和分析。

三、大數據時代下企業管理的特點

(一)企業用于分析的數據量十分龐大

數據分析是當前企業管理過程中不容忽視的重要支撐點,企業需要有完整、真實、有效的數據進行支撐,企業需要使用大量的數據,才能夠對未來行業的發展趨勢進行有效的預測,從而采取積極的應對措施,制定良好的戰略。以往情況下,對于數據的收集、存儲以及分析都存在著一定的局限性,企業在分析和處理相關信息問題的時候,都是從能夠獲取到的少量信息中,最大限度的挖掘和分析自身所需要的信息,這在無形之中增加了企業的工作量,同時信息的不完整性、滯后性等問題將會直接影響到企業的全面發展。在大數據時代來臨之后,現代企業可以采用更加積極有效的方式,對市場信息、客戶情況以及行業間的發展情況進行全面充分的了解和掌握,這就減少了主觀性判斷的缺陷,為企業不斷提升自身的核心競爭力,擴大產業規模提供了良好的前提基礎。大數據時代中的一個鮮明特點就是樣本即為總體,它對于全體數據進行追求,但并不會只依賴于隨機樣本,既擴大了數據的獲取范圍,又提升了解決問題的精確性。

(二)數據的精確性要求有所降低

在小數據時代之中,企業需要建立自身專門的數據庫,對自身收集到的各項數據進行存儲、整理,不斷提高和優化數據的準確性,主要是因為如果數據之中出現了一定偏差,將會給企業的正確戰略決策造成負面影響,小數據時代中數據的疏忽造成的后果會被放大。而處在大數據時代下的企業管理并不需要面臨這個困擾。大數據時代中,企業能夠獲取到的數據信息越來越全面、完整、真實,這樣就能夠因為數據量的增加,減少數據的錯誤率。企業管理過程中針對某一個錯誤問題,都能夠及時的進行調整,增強了企業自身的糾錯能力,企業應用大數據,并不單純是為了數據的準確性,更多的是從數據之中挖掘潛在的價值信息。

(三)對事物之間的相關性進行尋找

大數據時代和以往的區別還體現在一個重要方面,那就是對于事物之間的因果關系不再進行重點研究,而是將研究的重心逐漸放在事物之間的相關性方面。大數據時代,逐漸摒棄了提出假設――分析數據――處理數據――驗證假設的方式,而是從低價值密度的數據中,對具有潛在價值的信息數據進行充分挖掘,從而對事物之間的關聯進行全面探索。

四、企業管理中對大數據的應用價值

當前企業對數據管理的重視程度越來越高,積極挖掘和發揮大數據在行業發展中的價值和作用,這樣能為企業管理者制定相關的決策提供良好的信息、數據支撐,有效提高決策的正確性。企業管理中對大數據進行充分應用,具有良好的價值。

(一)企業管理中對大數據進行應用能夠促進精準營銷

現代科學技術的不斷創新和進步,有效促進了社交網絡的興起和移動通信技術的良好應用,這樣就促使人們的日常生活中隨處可見網絡的身影。人們在日常的網絡交流之中,因為社交聊天、網絡購物、興起愛好以及行為方式等等,都會通過圖片、文字和視頻等多種形式在網絡上留下相關的數據,這樣就能逐漸形成實施動態網絡化的大數據。企業在經營發展的過程中,需要對消費者的購物習慣、市場的飽和程度、市場的需求情況等各方面進行全面的了解和掌握,這樣才能夠有效促進決策的正確性。因而企業在進行管理的時候,需要積極應用云計算的手段,對消費者的網絡化行為數據進行深入分析,這樣能夠對市場進行細化,同時還能夠根據消費者的購物目標,有目的性的開展精準營銷活動。現代社會的用戶,他們在網絡上的各種實時動態數據,將會為企業進行精準性的營銷提供良好的數據和信息支持,從而促進企業營銷工作的順利進行,還會在極大程度上提高現代企業的營銷水平。大數據時代下運用的信息技術,能夠對消費者的相關情況進行有效的觀察,并進行記錄,這就為提高企業管理精準營銷的效率發揮了重要作用。

(二)企業管理中對大數據進行應用能夠有效推動產品實現創新

企業在對消費者的消費需求進行分析的時候,積極使用大數據技術,能夠對產品、服務的不斷創新創造良好的條件。消費者在進行購物之后,能夠將自身對于產品、服務的評價和感受通過社交網絡平臺、購物平臺進行反映,現代企業可以通過對消費者的這些信息進行收集,作為自身產品、服務的反饋信息,從而根據顧客提出的一些問題、建議等,對自身產品和服務進行不斷的改進和完善,這對于提高企業產品和服務的總體質量和效果具有積極的作用和意義。同時根據多不同產品和服務的評價信息,現代企業能夠積極吸取相關優秀經驗,從而豐富自身的產品風格,根據消費者的創意性反饋信息,生產相應的新產品。現代企業通過對消費者的信息進行分析和改進,能夠逐漸提升自身的服務意識和創新能力。產品和服務的不斷創新,在企業的全面發展中占據十分重要的地位和作用,能夠影響到企業的經營能力和發展成果,在對企業進行全面管理的過程中,需要對企業中的大數據進行全面有效的應用,這樣能夠讓企業永遠保持新鮮的活力,積極應對市場的變化。

(三)企業管理中對大數據進行應用能夠對產品流程的優化進行加強

科學技術的不斷發展,用機器代替人工進行生產,已經逐漸成為了當前企業生產的重要方式和手段,這對于提高工作生產效率具有良好的作用,實現了信息化和智能化、數據化的生產運作。尤其是網絡技術不斷發展下,物聯網和云計算這些技術的有效應用,為企業對產品的生產、制造進行全面控制和管理,提供了重要的技術支持。當前在對產品進行制造的過程中,產品的生命周期能逐漸實現數據化,這對于保證產品的質量,提高其使用的性能具有良好效果。應用大數據云計算技術和大數據技術,能夠對產品的設計研發、生產制造以及運營管理等方面的各項數據進行全面有效的智能分析,這對優化產品的生產制造流程具有十分積極的促進意義。通過大數據技術,企業在進行管理的過程中,可以將自身的各項數據進行整合,從而形成完整的數據規模,在進行相關決策的時候,可以對這些數據進行分析和應用,從而尋找到適合決策的信息。同時企業還能夠通過大數據技術,對各項數據進行深度的挖掘,針對數據所包含的高潛在價值進行充分的應用,這樣能夠建構起完整的數據模型,在進行產品流程優化的時候,能夠做好相關的支持工作。加強產品的流程優化,能夠為提高產品的生產效率和質量效果起到良好的促進作用。

五、結束語

大數據時代下企業管理的特點主要包括企業用于分析的數據量十分龐大,數據的精確性要求有所降低,對事物之間的相關性進行尋找。因而企業管理在使用大數據技術的過程中,需要對這些特點進行重點關注,結合企業自身發展的現實情況,采用積極有效的手段進行。企業管理積極應用大數據,能夠起到良好的效果和作用,主要表現在不僅能夠促進精準營銷,還能夠對產品和服務的創新能力進行提升,這對于企業的長久發展具有重要意義;同時,使用大數據還能夠加強企業對產品流程的優化,從而增強產品的生產效果,保證產品和服務的質量。

參考文獻:

[1] 吳雅軒,劉建基.企業管理視角下大數據應用價值的探究[J].商場現代化,2014(22):110-110

[2] 方獻梅,劉亮龍,高曉波.大數據時代數據挖掘在證券公司客戶關系管理中的應用研究[J].信息與電腦:理論版,2015(15):64-65

[3] 孟強.大數據時代知識管理在電商企業中的應用研究[J].經營管理者,2015(24):278-279

[4] 張志兵.大數據分析在中小型企業管理中的應用探討[J].價值工程,2016,35(8):213-214

[5] 楊宏宇,朱信穎,顏瑋瑋.大數據在電網中應用的價值研究[J].數字技術與應用,2014(9):90-90

篇4

目前,隨著時代的不斷發展,數據新聞可以說是大數據時代背景下的必然產物。傳統媒體的模式和格局都隨著大數據時代的到來而出現巨大的改變,這是由于大數據時代資料的獲取渠道不再取決于傳統媒體。處在大數據時代,好像所有的領域都能夠和大數據相連,很多的非系統化、毫無關聯數據的增加,促使傳統媒介的新聞方式遭受到了巨大的挑戰。在這種情況下,大數據利用其自身的優勢,也就是容量大、種類多樣、及時性高、獲取困難等,在新聞生產過程中獲得了業內人士的青睞。數據新聞成為國際媒體工作者,在大數據時代背景下進行的重大改變。這種新型的新聞生產模式,把冗亂的新聞案件用更加直觀、清晰明了的方式呈現在觀眾面前,是廣大群眾能夠通俗易懂的掌握新聞案件的來龍去脈。媒體工作者的工作重心也由過去的搶先新聞轉變成幫助人民群眾了解案件出現的內在關系及造成的影響。

2 數據新聞:大數據時代的必然產物

在大數據的時代背景下,媒體工作者利用對數據的獲取、處理和分析生產的數據新聞,能夠幫助人民群眾更加真實的清楚他們處于的變幻莫測的社會,從另一個方面來說也可以幫助媒體完成其保障群眾利益的根本目標。現階段,國內外有很多專家學者都對數據新聞進行了深入的探究,但他們對于數據新聞的理解及研究存在著不同程度的差異。整體而言,我們能夠認為數據新聞即立足于數據的獲取、整理、挖掘和解讀的基礎上,選擇直觀的數據技術來新聞的新型模式,它是國際媒體行業在大數據時代開辟的新道路,指引了未來新聞領域的奮斗方向。數據新聞與傳統新聞生產模式相較而言有其自身的優勢,即數據新聞的要依賴在公開信息的基礎上、數據新聞會選擇獨特的軟件來處理信息、數據新聞多數都是以生動溝通的直觀方式來新聞以及數據新聞堅持保障人民群眾利益為己任等,這些特點都決定了數據新聞逐漸成為媒體領域未來的發展趨勢,是大數據時代背景下的必然產物。

3 數據新聞對新聞生產的影響

3.1數據新聞給傳統媒體領域增添了活力

數據新聞跟傳統的新聞相較而言,其屬于一種全新的新聞播報形式,它在成長的過程中會保留傳統新聞播報的有利之處,還會給媒體領域增添活力,如升級了傳統新聞播報的模式、處理數據程序及展現形式等。

3.2數據新聞促使新型新聞方式的出現

數據新聞促使預測性和眾包調查式新聞方式的出現,極大地推動了數據新聞的發展。由于大數據時代的不斷進步,人們對數據的研究也會逐漸完善,數據新聞會給傳統新聞帶來很大的挑戰,而預測性新聞也逐漸受到人們的關注。數據新聞的預測性不是個別人的觀點,而是在可靠的數據分析技術的基礎上,在本質上研究了事件的相連關系,滿足預測性新聞真實性的價值定位。眾包調查式新聞方式的出現對網絡商業團體的成長起到了非常重要的促進作用,新聞行業也引進了這種報道方式,眾包式的數據新聞能夠在未來的新聞行業取得巨大的成就。

3.3數據新聞促使新聞價值的評判標準產生變化

每個新聞的制作都要有自身的價值,它需要符合觀眾對數據的某方面要求。而傳統的新聞價值的評判標準逐漸不能適用于大數據時代數據新聞的評判標準。目前,數據新聞的評判標準主要是發掘數據資料背后隱藏的深層想法。數據新聞自身的優勢決定了新聞價值標準的變化,使觀眾能夠更加直觀清晰的掌握數據背后隱藏的深層想法。

3.4數據新聞促使新聞職業理念產生變化

新聞真實性是新聞學區域內永遠追求的目標,是新聞工作者的基本準則,也是新聞一直以來都遵守的原則。在過去的新聞制作過程中,記者想要自己的新聞成為獨家的,經常會把自己得到新聞資料的數據進行密封。而在數據新聞的制作過程中,記者無法密封數據信息,每個人都能夠隨意瀏覽,且我們在使用的過程中也能夠檢驗數據的真實性,加強了數據的公正性、真實性。

篇5

“用手機上網,搜索簡單的四個漢字,可能就需要消耗60個15瓦燈泡的能量。數據的產生是需要用電的。在云時代,一個數據中心所要耗費的能量是驚人的。”這是記者在在日前召開的2013施耐德電氣云計算數據中心創新峰會上聽到的一個觀點,由此產生的一個問題擺在我們面前:云時代數據中心應該如何進行能效管理?

能量的邏輯

施耐德電氣全球高級副總裁、APC大中華區總裁黃陳宏指出:“我們正處在一個‘大數據’引領的智慧科技時代。‘快速化’、‘大量化’和‘多樣化’作為‘大數據’的顯著特征,從部署速度的實時性,部署量級的規模化和全方位的智能化管理方面對數據中心提出了新的要求。在如今這個以“澤”(Zettabytes)為衡量數據量的時代,隨著數據量的爆發式增長,大型、超大型數據中心的可擴展性也越來越受到關注。”

有數據顯示,在2013年,全球有50%的數據中心邁向云計算。云時代大數據的特征,也使得未來數據中心的規模過去不可同日而語。施耐德電氣IT事業部大中華區副總裁、數據中心業務總經理曲穎告訴我們,過去一個銀行的數據中心約在500到幾千平方米左右,但是現在,“我們接觸到的越來越多的銀行,都在規劃建設5000到20000平方米的數據中心。據統計,一個20000平方米的數據中心,一年需要耗費20兆瓦的電量。現在有越來越多的萬米數據中心建設在中國的北方地區,比如,這是一個應時而生的變化。”

對于整個行業而言,如何在云時代數據中心的規劃設計、建設運行中更多地節約能效,積極地面對能源的消耗和碳排放的控制,對于這些數據中心的所有者而言,既是一個未來發展的趨勢,也會是要面對的一個巨大挑戰。

一個大型數據中心在規劃建設之始,居然也要“看風水”。在北京建數據中心,東北風和西北風吹來的方向,決定了數據中心窗戶的朝向。因為要對一個數據中心進行能效管理的話,首先就要盡可能地利用自然冷卻,以減少空調所帶來的耗電量。所謂“風水”,就是在規劃數據中心之初,把是否能夠最大程度利用地理條件帶來的便利放在首要位置上考慮。

曲穎說:“在數據中心里,我們不講節能,而講能效。因為能量是有邏輯的,當我們把能源的邏輯理順,能源效率得到提高后,不僅達到了節能的目的,還使數據中心變得更可靠、更優化了。”

數據中心基因的作用

大數據時代,數據庫的內容不僅海量,而且結構也發生了極大變化。大量非結構化數據的涌入,不僅對數據中心基礎設施帶來壓力,也使數據中心管理平臺從“設備級監控”、“被動級管理”、“主動級管理”、“自動化管理”逐步向“智能化管理”邁進。同時,數據中心的規模也在不斷地擴大,可能是幾千平米。但是現在,越來越多的數據中心已經突破了一萬,甚至幾萬平方米。這在能效管理與建設規劃方面都提出了更高的要求。

黃陳宏進一步提出數據中心的“基因”一說,他認為數據中心擁有業務基因和技術基因,“要讓我們的數據中心能夠跟上云時代的發展,我們必需依靠數據中心的‘基因’。”

國內的通信運營商在全國有幾萬,甚至幾十萬個規模不一的基站,如果要把這些基站進行智能化整合,應該怎么做?

曲穎說:“這就要求我們對數據中心的‘基因’有著更深入的認識。如果將企業、或是一個智能機構比作成是一個生命體,那么它的特點由其基因來決定。不同的基因有不同的特征使得數據中心有著不同的特質。舉個例子,如何滿足客戶在兩周之內要完成移入一萬片刀片服務器的要求,這就需要你能夠掌握數據中心的基因密碼,然后在此基礎上實現快速重組。通信企業在并購后,存在不同組織結構下的IT設施如何進行更有效整合的問題。這對于數據中心的建設與運行,也是一個很大的課題。這個時候,只有充分了解掌握了這些IT設施的“基因”,并進行重組,才有可能達成目的,組合成一個全新模式。”

事實上,在數據中心的規劃、建設過程中,也無時不刻需要考慮到“基因”問題。在能效管理環節,“基因”更是關鍵點。據了解,在北京上地的IBM數據中心項目中,施耐德通過重組基因的方式,復制優質基因,幫IBM實現了PUE從1.77下降到1.5以下,每年節約運行成本約100萬人民幣;位于北京經濟技術開發區(BDA)的Telehouse北京數據中心,施耐德電氣可幫助其實現高達25%的節能目標,并達到Telehouse在中國大陸地區的最低PUE值,實現最高能效水平。

“經過這樣優化之后的數據中心,才有可能是最優質的、最賺錢的數據中心。”曲穎說。

軟件定義數據中心

在云時代,對數據中心的設計師建設、基礎設施的管理控制也有新要求,黃陳宏進一步提出:“由軟件來定義數據中心會是將來的一個必然趨勢。”

篇6

關鍵詞:大數據;新聞傳播;創新路徑;數據方法

一、前言

針對現階段國內的大數據發展狀況和互聯網技術的發展條件,研究傳統的新聞傳播正面臨的機遇和挑戰,從而適時轉變新聞傳播方式,使之更加符合現階段技術發展的特點,對新聞工作者而言,是必然的選擇。而在大數據時代的背景下,創新新聞傳播的路徑,強化新聞傳播的效果,對傳播學的理論發展和新聞發展的實際而言,都具有重要作用。

二、大數據方法和時代特征

(一)海量的數據

大數據一項非常顯著的特征在于數據的數量極大。網絡上數據的膨脹速度也是以指數上升,而不同用戶之間的交流和轉載又進一步促進了數據數量的提升。文字、圖片、聲音和視頻的數量不斷增加,其海量的數據內容對新聞傳播提出了嚴格的要求。如何從數據時代爆炸式增長的數據中找到合適的內容,需要新聞工作者對此進行創新的研究。

(二)關聯性和實時性

互聯網的使用者不僅可以信息,更能夠搜集、檢索和傳播信息。數據間的關聯性正在變得越來越強,而許多受眾隨手拍攝生活中的事件、隨手傳播到網上的行為,又進一步提高了數據的實時性。在這一前提下,如何利用大數據,從看似不相關的數據中整理出其中的相關性,并利用網絡平臺進行傳播,正在成為考驗新聞工作者信息搜集能力的工作。[1]

(三)大數據方法和新聞傳播創新

大數據的運行方法與傳統方式有著極大的不同,大數據可以采用專門的程序和算法進行處理,利用其成果進行對未來發展趨勢的預測也變得更加簡單。它將社會的整體局勢和動態進行全方位的研究和分析,因此在這一背景下,進行新聞傳播的創新需要強調兩個方面:其一是新聞形式需要創新,降低文字比例,增加圖片和表格等能令人迅速理解的內容;其二是新聞內容需要創新,對新聞內容進行整合分析,減少新聞的不確定因素。

三、大數據方法在新聞傳播中的應用

(一)數據的有效性

新聞傳播最需要強調的仍然是新聞的真實性,這一點在大數據的背景下,就變成了新聞數據的有效性。即使大數據時代的新聞被娛樂化了,但從根本上,新聞強調的仍然是其真實性,也就是說,強調數據的有效性,是新聞傳播中大數據方法和技術的最根本的應用方式。通過數據分析技術,解析網絡中各種信息的有效性,從而保證新聞內容的真實性,這是保證新聞傳播可靠性的根本方式之一。

(二)平臺的可靠性

另外,在新聞之前,需要選擇可靠的平臺。這一平臺的選擇標準是擁有合適的流量、平臺本身具有高度的可靠性。其中后者的重要性比前者要大很多,只有平臺本身具有高度的可靠性,才能令受眾對新聞內容有著高信任度。[2]在新聞內容本身具有高度真實性的前提下,將其在可靠的信息平臺,有助于進一步提高關注度,強化新聞傳播的效果。

四、大數據時代新聞傳播創新路徑

(一)轉變思維方式

大數據時代新聞強調的已經不是“前因后果”的完善的因果關系鏈,而是不同信息之間的聯系度。只要具有高聯系度,即使不能理解其中的因果關系,也能夠放在一起作為“新聞”的一個部分。在這一情況下,新聞工作者在進行新聞傳播時,需要轉變傳統的探究理由的思維方式,轉而尋找不同信息中的關聯,找到看似毫不相關的信息中具備的聯系,將之進行梳理整合,以提高新聞內容的傳播價值。

(二)變革分析模式

大數據時代的數據分析模式與傳統的分析方式有巨大的差異,其有專業的分析軟件來進行數據分析。新聞工作者可以利用有效的數據分析方法,將龐大的數據分析交給計算機運行,通過這種方式,改變數據和信息的分析模式,以降低自身的工作量,提高工作效率和新聞內容的高度準確性。

(三)轉變結論方向

大數據時代數據樣本的增加,雖然機械的信息處理技術一定會帶來某些問題,但它能夠處理海量的數據資料,從中得出的結果會因此而更加偏向于對宏觀問題的推測。因此,新聞工作者需要轉變得出結論的方向,從分析社會中存在的各種“小問題”的前因后果,轉而對社會整體變化方向進行宏觀的分析和預測。

(四)傳統紙媒的應用

即使在大數據時代下,紙媒的生存空間越來越小,但不能徹底放棄傳統紙媒。紙媒在現階段的新聞發展中,其缺陷主要體現于時效性,其真實性、深入性和對思想的指導作用并沒有受到影響。在紙媒中具有高度真實性的、能夠對事件進行深入討論的相關內容,以此來引導人們的思想,仍然需要新聞工作者加以重視。[3]

(五)強調微傳播平臺的力量

微傳播平臺,指的就是以微信、微博為代表的網絡社交平臺。這一類的平臺在信息傳播的速度和廣度方面存在著極大的優勢,通過數據分析出某一個公眾號或微博大V的關注者普遍關心的問題,推出具有針對性的新聞內容,同時利用推送功能加強突發新聞的報道效果。

五、結語

由于大數據時代的到來,新聞傳播在面臨嚴峻的考驗的同時,也迎來了發展的良機。但如何將大數據時代的方法和技術應用到新聞傳播中,對新聞傳播的路徑進行創新,則是需要深入思考的問題。本文針對大數據時代海量的數據、極高的關聯性和實時性,分析大數據方法和新聞傳播創新間的聯系,指出利用大數據方法進行新聞傳播路徑創新必須遵循的兩個基本原則在于數據的有效性和平臺的可靠性。針對大數據方法的特點,新聞傳播創新路徑需要轉變思維方式、變革分析模式、轉變結論方向,在不放棄傳統紙媒的同時,強調微傳播平臺的力量,促使新聞傳播能力得到顯著的提高。

參考文獻:

[1]馬建平,馬瑞.大數據時代新聞可視化傳播的創新路徑[J].新聞研究導刊,2017,8(03):152-153.

[2]華曉雯.大數據時代新聞可視化傳播的創新路徑[J].新聞研究導刊,2017,8(02):163.

篇7

云計算IT行業的大趨勢,越來越的企業開始考慮或者著手部署云計算。不過,業內人士提醒,作為一種新的部署和利用IT技術的方式,云計算對數據中心的基礎設施有著較高的要求,換而言之,如果還是采用傳統的數據中心基礎設施,是很難滿足部署云計算的要求的。

“云計算的典型特點是高密度負載以及靈活地動態調度,這就要求數據中心的基礎設施能承受這種高密度負載的靈活遷移。”施耐德電氣IT事業部全球數據中心副總裁Paul-Francois Cattier告訴記者,傳統數據中心由于沒有考慮這么高密度的負載,所以在供電能力和制冷能力上常常難以滿足需求;同時,在管理手段上也不支持負載在數據中心范圍內自由調度。

另外,傳統數據中心在電能利用效率過低,通常PUE值會在2.2,而一個設計良好的數據中心其PUE值可以降到1.3,甚至1.1。

“降低電能消耗,提高用電效率,是對新一代數據中心或者說云時代數據中心的基本要求。這既是社會責任,也是降低數據中心運營成本的必然選擇。”Paul-Francois Cattier說,相關研究表明,在數據中心的整體運營成本中,電力成本可能占到40%-50%,如此之高的占比提醒我們降低電能消耗的重要性。

什么樣的數據中心可以滿足云計算的要求?對此Paul-Francois Cattier認為,數據中心必須具有如下特征:

1. 標準化。新一代的數據中心一定是采用各種標準化的組件,符合各種國際標準。只有這樣才能保證快速部署,比如,集裝箱式數據中心只要幾周就可以快速構建起來。

2. 高密度。云計算是一種集中化的部署方式,要在有限空間內支持高負載,刀片式服務器等高密度設備是必然選擇。

3. 模塊化。數據中心要滿足動態的需求,必須具有一定伸縮性。同時,為了節省投資,最好能邊成長邊投資,而模塊化就是最好的選擇。另外,模塊化還能提高可靠性和節電。

4. 集中化的管理。傳統數據中心IT設備與基礎設施是由不同的人分開管理的,通常,IT設備由IT部門管理,而基礎設施則由基建部門負責。以虛擬機在不同機柜中的遷移為例,傳統的IT管理工具通常只關心那個機柜中是否有合適的IT資源,而實際上,如果某個機柜中如果制冷能力不夠,即使它還有冗余的計算能力也不適合增加新的負載。

“如今,這個問題已經引起了廠商的關注,包括施耐德電氣旗下的APC在內一些廠商已經推出了集成化的管理工具,為云環境的管理提供了很大的方便。”Paul-Francois Cattier說。

====以下簡訊===

首款本土化設計桌面虛擬化產品面世

10月27日,在VMware公司主辦的VMware中國用戶大會上,福建升騰資訊有限公司與VMware正式聯合業內首款專為中國客戶量身定制的桌面虛擬化解決方案——升騰CT Vision,全面滿足本土市場虛擬化桌面終端管理需求。升騰CT Vision是雙方自2010年10月達成戰略合作伙伴關系以來,充分利用各自在瘦客戶機產品研發、桌面虛擬化方面的優勢,共同推出第一款專為中國用戶設計的桌面虛擬化產品,也是目前業內外設支持最好的桌面虛擬化產品。

Sybase ASE 15.7正式上市

日前,SAP旗下的Sybase公司的全新版本的企業數據管理解決方案Sybase ASE 15.7正式上市。作為SAP Business Suite商務套件的基礎,ASE 15.7不僅為SAP客戶提供了一個強大的數據庫支持,也可以讓現有的Sybase ASE客戶方便地采用最新功能和優化特性,而不需要升級數據庫。更為重要的是,具有全新先進壓縮功能的ASE 15.7還可以節省磁盤空間、提高并行硬件的性能和可擴展性,有效管理非結構化數據。強大的功能足以應對大數據時代對數據處理性能、類型、安全等方面的挑戰。新版ASE有5大重大改進,包括面向存儲的優化、應用程序開發效率提升、診斷與監測的提升、增強的安全管理和性能提升。

Oracle NoSQL數據庫支持大數據應用

甲骨文公司日前宣布,Oracle NoSQL數據庫即日起可以在Oracle技術網下載。Oracle NoSQL數據庫是Oracle大數據產品線的關鍵組成產品之一。Oracle NoSQL數據庫能夠幫助客戶以動態架構輕松管理大量數據,例如博客數據、傳感器和智能電表數據、個性化數據收集以及社交網絡存留的數據。此外,甲骨文公司還將提供一款新型集成設計系統,即Oracle大數據機(Oracle Big Data Appliance),該系統可以對Oracle NoSQL數據庫以及其它Oracle大數據產品進行優化。Oracle大數據機將于2012年第一季度面市。

Infor 10 為企業軟件注入新體驗

Infor日前宣布推出Infor10和Infor10 ION軟件套件。Infor10具有消費者級用戶體驗和完整行業應用特性,Infor10 Workspace是Infor10的前端,旨在提供一個消費者級用戶體驗并改變普通企業用戶的工作方式;而Infor10 ION軟件套件是一個能夠改變企業軟件管理方式的輕量、中間件技術,作為Infor10的核心,ION連接并集成了Infor和非Infor的應用程序,并在一個常見的格式和庫里存儲信息。

SUSE基于OpenStack的云基礎設施解決方案

SUSE公司于近日宣布,其開源、云基礎設施解決方案的初步開發快照已。SUSE公司正在通過增加在商業上得到支持的工具,幫助客戶快速輕松地構建私有云基礎設施來擴展其解決方案產品包。該公司的SUSE Cloud是業界第一個經過充分配置的、基于OpenStack Diablo的可供公眾使用的軟件設備。它還是SUSE開源、開放標準、廠商無關的云基礎設施解決方案首個快照。依靠SUSE Enterprise Cloud Infrastructure這樣的開放解決方案,客戶可在私有云基礎設施的跨物理和虛擬環境中具有更強大的視程,從而使資源得到更好的利用、使業務更加高效。

Nimsoft服務臺提供托管的IT服務管理

Nimsoft日前宣布,Nimsoft服務臺作為一款基于SaaS模式的創新型解決方案,在亞太市場中被客戶廣泛采用。這款獨創的SaaS解決方案自推出伊始,來自服務提供商和企業客戶的需求持續顯著增長。

Nimsoft服務臺是一個純粹的SaaS多租戶解決方案,用戶可通過一個自助服務門戶獲得廣泛的能力,包括提交變更請求、請求服務、報告事件,并利用一款知識管理引擎來立即解決各種常見問題。同時,這種可按需定制的解決方案提供了基于ITIL的工作流程,以及多年的最佳實踐知識。 2010年3月,CA Technologies收購了Nimsoft。

百年伊頓創新為本

篇8

【關鍵詞】大數據時代;圖書館管理;建議;研究

隨著知識經濟的快速發展,各行各業不斷進行改革,網絡化體系也在不斷完善,大數據時代隨之到來,而且全球大數據也呈現出快速增長的趨勢,并且被運用于各行各業。在對圖書館的管理中,由于圖書館本身存儲書籍、文獻較多,電子資源也急劇增加,根據其發展趨勢,漸漸引發對大數據的考量與探索。本文主要分析了大數據時代圖書館的特點與需求,對圖書館管理在大數據時代所遇到的挑戰和問題進行了總結,并對如何合理的對圖書館進行管理提出了建設性的策略。

一、大數據時代,圖書館對于大數據的需求分析

大數據,顧名思義就是大容量的數據整合在一起,其本身的特點就是容量大、種類復雜、更新速度快速且處理起來較復雜。大數據的種類比較多樣化[1],分類也比較復雜,如關于業務流程方面的數據、關于企業、社會以及個人的大數據、科學研究方面的大數據等等。但是利用大數據也有非常多的好處,在數據的收集整理以及信息傳遞方面可以有效減少對人力財力的大量投入,而且可以高效率的完成任務,對于一些信息可以準確的進行分析、判斷和評價,有效促進了個人以及企業的辦事效率和業務能力。

二、大數據時代,圖書館管理面臨的問題與挑戰

因為我國對于數字圖書館的建設起步比較晚,所以數字圖書館發展到今天,對于它的管理還存在著許多問題,而且面臨著許多困難和挑戰,如果對其不加以重視,將嚴重影響數字圖書館的發展。

(一)成本高,社會投入力度不夠。

我國對于數字圖書館的建設由于起步晚,還正處于發展的初級階段,而且在資金投入方面,也僅僅是依靠中央或者是地方政府,一小部分主要依靠企業的投入,其他途徑的投入很少甚至沒有,比如對于國家數字圖書館的建設,靠的是中央財政方面的支持,對于諸如中國知網等資源的投資建設主要依靠的是企業。但是由于數字圖書館在發展過程中數據不斷增多,對數據與資源的挖掘也在不斷進行,這其中需要大量的人力和財力。所以,對于數字圖書館的建設,面臨的最大困難就是資金的短缺。首先,數字圖書館牽扯到知識產權方面的問題,但是對于數字圖書館的建設目的是服務大眾,具有一定的公益性質,在此基礎上使得圖書館的建設在資金方面嚴重不足。其次,政府每年對于數字圖書館的資金投入都是一定的,而且投入的資金數量并不能滿足圖書館的資源建設,政府的資金投入都是一次性的,僅僅局限于建設一些硬件設施和設備,對于圖書館的長期建設起不到作用。

(二)對于資源不能做到共享利用。

建設數字圖書館,在一定程度上的目的就是無論任何人在任何地點,不論使用什么樣的數字化設備都能找到自已所需的資源[2]。但是我國目前對于數字圖書館建設根本無法達到這一目標。大多數的圖書館服務系統僅僅局限于對于資源的管理和檢索,一小部分的數字圖書館雖然漸漸地向移動通信等網絡平臺方面發展,但是由于發展水平比較低,并且只是局限于傳統的數字化體系,并沒有進行理念和技術上的創新,所以,根本不能滿足用戶的需求。而且一些數字圖書館在發展的過程中都是閉門造車,自成一體,對于資源不能做到合理的共享和利用。

(三)對于數字圖書館的建設的機制不完善。

在對數字圖書館的建設過程中,機制不完善主要體現在:1.由于只重視數字化資源的建設,使得資源不斷重復保存,而且并沒有做到資源的長期保存;2.與工作相關的文件、網頁信息以及影像方面的資料保存數量太多,導致對于非結構化與結構化的資源數據存儲量太低,導致資源結構失衡。

三、對于圖書館管理提出的策略和建議

(一)整合資源,改進保存方式。

在大數據環境的影響下,對于大部分的館藏文化可以實行數字化,但是對于少部分數據沒必要進行數字化,所以對于這一少部分數據來說,必須要對其合理的收集和整理,特別是針對保存比較完整的文獻,要長期重視這些資源的保存問題,合理選擇存儲介質進行多種形式的備份,重視資源的安全管理。

(二)改善資金投入模式。

數字圖書館在管理過程中遇到最大的問題就是資金投入的力度不夠,所以在建設數字圖書館的時候可以發動社會力量[3],比如利用一些基金會,比較專業的結構或者個人對圖書館的建設進行投資,增加資金來源,并在資源方面共享化。對數字圖書館的建設要進行長期有效地規劃。

(三)合理避開有關知識產權方面的風險。

在數字圖書館的建設過程中,對于圖書管理員專業知識的培養是非常有必要的,要不斷提升圖書管理員的知識素養,鼓勵圖書管理員將知識產權方面的知識向公眾進行宣傳,建立專業規范的資源管理體系,使得圖書館在建設過程中合理有效的規避知識產權方面的風險,保護數字圖書館的合法利益。

結語

本文通過對數字圖書館發展現狀進行分析,發現大時代環境下的數字圖書館在發展過程中遇到的問題:成本高,社會投入力度不夠;對于資源不能做到共享利用;對于數字圖書館的建設的機制不完善。據此提出相關的解決措施:整合資源,改進保存方式;改善資金投入模式以及合理避開有關知識產權方面的風險,對于大數據時代圖書館的管理具有重要的借鑒作用。

參考文獻:

[1]柯平,朱明,閆娜.國外圖書館管理研究述評[J].中國圖書館學報,2013(05).

[2]李黛君,毛贛鳴.版權平衡:數字圖書館法權辨析[J].情報理論與實踐,2013(07).

篇9

〔關鍵詞〕大數據;情報學;研究方法;非結構化數據

〔中圖分類號〕g250.2〔文獻標識碼〕a〔文章編號〕1008-0821(2013)08-0058-03

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理,并整理成為幫助企業經營決策更積極目的的資訊。

隨著云時代的來臨,大數據(big data)也吸引了越來越多的關注。《著云臺》的分析師團隊認為,大數據(big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像mapreduce一樣的框架來向數十、數百甚至數千的電腦分配工作[1]。所以大數據時代對于各個學科的要求都提高了很多,對于情報學專業而言,大數據時代同樣帶來了很多挑戰和機遇。

1大數據時代情報學面臨的挑戰

進入2012年之后,“大數據”一詞被越來越多的人所提及,它用來描述信息大爆炸時代產生的海量數據,時至今日“大數據”的研究價值已經可以和黃金相媲美。所謂“大數據”顧名思義,首先是數據量要大,但是并不是數據量大的數據都可以稱之為大數據,ibm公司大數據的特點是4個v:volume(大量)、velocity(高速)、variety(多樣)及veracity(真實),它提供了在新的和正在出現的數據和內容中洞悉事物的機會,使業務更加靈活,并回答以往沒有考慮到的問題[2]。gartner公司的報告也提出,大數據是大容量、高速和多樣化的信息資產,它們需要新的處理方式,以提高決策能力、洞察力和流程優化[3]。

在筆者看來,“大數據”還應該加入一個特點就是海量資料之間的關聯程度。如果有一批更新速度極快的多樣真實的大量數據,將這批數據看作一個整體,每個單獨的數據看作是整體的一個組成部分,這些組成部分之間毫不相關,數據彼此很孤立,數據間的關系不清晰很難捉摸,看上去并不像一個整體,相反地更像是一盤散沙。這種零散的海量數據之間的關系斷裂,其關聯程度很低,也就導致其含金量減少,不能形成所謂的“大數據”。

由此可見,大數據時代的背后其實有更加深刻的理念,同時這些理念也為情報工作者帶來了新的挑戰。

(1)大數據時代從字面上理解只是進入了一個海量數據時代,而實際上大數據時代更深刻的理念在于它帶領我們進入了數據分析時代,數據的分析隨著大數據時代進入了一個前所未有的黃金時期,如何從海量數據中獲取有用的信息成為情報工作者面臨的新挑戰。

(2)大數據時代的另一個特點就是其多樣性。進入大數據時代之后,數據的種類除了包括一部分結構化的數據以外,還包括很多非結構化的數據,例如文本、音頻、視頻等很多形式的數據。情報工作者要挖掘的某些規律可能隱含在各種形式的數據中,而同一種形式的數據又有可能含有很多規律,如此一來,大數據時代就要求情報工作人員的統籌兼顧,不能漏過任何一種類型的數據。

(3)大數據時代不僅僅是數據量的巨大,其最主要的特點還有velocity(高速),這一特點就迫使情報工作人員必須打破以往的人工分析的工作模式,計算機智能分析將成為未來大數據時代數據分析的主流技術。

在大數據時代中,要求將情報學和其他各個學科相結合,在其他學科的各個領域內應用情報學的知識對海量的數據進行分析研究,并將各個學科領域內的研究都歸為情報學的一個組成部分加以建設,情報學自身的優勢何在,劣勢何在,如何把握大數據時代這一機會進一步進行學科的完善,是我們應該思考的問題。

2情報學在大數據時代的發展趨勢

大數據時代的變革將會引領情報學進入一個嶄新的發展階段,英國萊斯特大學的markphythian教授在2008年發表了題為“intelligence analysis today and tomorrow”的報告中指出[4]:①獲知情境是非常重要的。忽略戰略環境、領導作風和心

因素等更廣泛的問題,都會引起情報研究的失誤;②加強信息之間的關聯。美國政府內部信息共享的障礙,分析人員無法獲得足夠的信息,以支持分析活動,導致情報研究預測失敗;③要學習更多外部的專業知識。這一舉措雖然不能保證分析的成功性,但將是競爭分析的重要信息來源。

在大數據時代背景下,通過對國內外學者和專家的研究成果的研究,筆者認為情報學未來發展的三方面趨勢:①情報學將會從原來的單一學科的研究轉變為多學科交叉結合研究;②情報學研究中數據的采集和獲取范圍將會從單一的結構化數據轉變為加入更多的非結構化數據;③情報學的分析方法將會從原來的人工分析為主體轉變為計算機智能化為主體的智能分析。

2.1單一學科的研究轉變為多學科交叉結合研究

情報學是信息大爆炸時代的新興學科,而面對大數據時代,信息量不但巨大而且更新速度極快,傳統的情報學研究方法已經不能滿足大數據時代人們對于信息處理的需求,傳統的情報學更多的是處理結構化的數據,而大數據時代給我們帶來更多非結構化的數據,非結構化數據的處理不是基于數學和邏輯運算,而主要是基于對內容含義的理解和語義分析,包括各種形式的分類、檢索、信息抽取和內容匹配等方法。傳統數據庫技術,例如sql語言在設計之初僅考慮了結構化數據,在海量非結構化數據中已然無用武之地。

未來情報學在發展中應該汲取各個領域的不同學科的方法和優勢,開創更多新型的研究方法來應對“大數據”的處理問題,而在非結構化數據的包裝下其數據的本源是什么,數據的含義何在,這些問題在以后的情報學研究中就需要涉及到本體論的相關應用來解決。為了順應大數據時代的需要,面對高速產生的繁雜的海量數據,本體思想無疑是解決內容含義和語義分析最有力的武器。  此外,對于很多企業的數據資源,情報學這一學科需要研究的除了用戶的行為挖掘之外,還要運用很多其他學科的知識進行輔助分析,例如心理學的相關理論已經逐步被引用到情報學領域,并起到輔助數據分析的作用,而情報學反過來在應用其他專業知識的同時也可以為其他專業提供新的思維和引導。如此一來,多學科交叉將會增多,多學科交叉研究將會成為未來情報學以及其他學科為順應大數據時代的一個發展方向。

2.2情報學研究中數據的采集和獲取范圍將會從單一的結構化數據轉變為加入更多的非結構化數據不同信息源可以從不同角度揭示問題,如專利、研究出版物、技術報告等,可以較為直觀地反映研究者對某科技問題的理解與描述,而評論文章、科技新聞、市場調查等,可以反映出社會對該科技的觀點、認知情況[5]。

在大數據時代,情報學這一學科需要研究的數據量更大,數據類型更多,很多在別人看來是無用的數據,在情報學看來它們可能是最有價值的資源,情報學在大數據時代更多的要學會“撿垃圾”,在海量資源中獲取數據的同時不能忽略任何一個可以找到信息情報的數據,可能某一數據表面看來毫無用處,但是當這個數據和其他數據整合在一起后就有可能是打開整個數據挖掘大門的金鑰匙。

雖然情報學的很多研究方法在處理非結構化數據方面不是強項,比如情報學的一些分析方法,在處理圖像信息和影音信息方面顯得后勁不足,但是在研究中同樣不能忽略這些資源,這也對情報工作者技術方面提出了更高的要求,開發新技術,更好的對數據進行分析將是情報學未來面對的難題。而為了得到更優質的研究結果,從單一結構化數據的采集和獲取轉變為加入更多的非結構化數據將會是情報學研究的必然趨勢。

2.3情報學的分析方法將會從原來的人工分析為主體轉變為計算機智能化為主體的智能分析正如美國國家科學基金會(nsf)的報告[6]所說,美國在科學和工程領域的領先地位將越來越取決于利用數字化科學數據以及借助復雜的數據挖掘、集成、分析與可視化工具將其轉換為信息和知識的能力。

由于非結構化的數據的大量引入,情報學不可避免的將面對一場技術上的革命,而傳統的人工分析不僅浪費人力資源,而且根本無法適應高速產生的數據群。開發計算機智能分析技術勢在必行,在技術上,計算機智能化分析將會以更快的速度解決不斷增長的海量數據,達到節約時間提高效率的作用。從數據類型方面,很多數據并不是傳統人工方法可以完成的,例如分析視頻和音頻,這就需要新技術的支持,未來如果不開發計算

機智能化新技術,將會導致很多視頻和音頻數據不得不被放棄掉。

計算機智能化新技術可以解放更多的人力去做更有價值的研究,同時也是大數據時代進行高速數據處理,高速數據挖掘的需要。未來情報學中計算機智能分析模型的建立將會對情報工作者提出更多的要求,情報工作者除了有數據分析和挖掘的能力之外,還應該具有數學邏輯思維來輔助計算機智能化模型的建立,傳統的人工分析為主體的分析方法,必然會被計算機智能化分析方法所取代,這不僅是大數據時代的要求,也是當今社會發展的必然趨勢。

3大數據時代情報學的機遇

狄更斯曾經說過“機會不會上門來找,只有人去找機會。”而大數據時代的來臨,無疑是為情報學的學科發展創造了契機。情報學還是一個比較年輕的學科,大數據時代的到來也顯示出情報學的“年輕”之處,如何將情報學進行完善,如何讓情報學走向成熟,這都將會在大數據時代中找到解決的機遇。

3.1完善學科技術和方法

美國mckinsey global institute在2011年5月了研究報告“大數據:創新、競爭和生產力的下一個前沿領域”[7]。報告分6個部分,其中第二部分討論了大數據技術,并圍繞大數據分析技術、大數據技術和可視化三方面進行了闡述。在大數據分析技術中,列舉了26項適用于眾多行業的分析技術,包括a/b測試、關聯規則學習、分類、聚類分析、眾包、數據融合和數據集成、數據挖掘、集成學習、遺傳算法、機器學習、自然語言處理、神經網絡、網絡分析、優化、模式識別、預測建模、回歸、情感分析、信號處理、空間分析、統計、監督學習、模擬、時間序列分析、無監督學習和可視化[8]。

大數據時代,無論是數據量還是數據類型,都要求情報學這一學科對于自身的技術和研究方法進行一次變革和完善,以往的技術不能解決的問題,在大數據時代的今天將會得到解決;以往的方法不能研究的問題,在大數據時代也將得到研究,這也是技術和方法的升華。大數據時代的到來,可以為情報學這一學科提供更強有力的數據處理分析工具和方法。

數據分析雖然是情報學的研究內容,但是大數據時代的契機下更多的人才進入這個領域,這樣就使數據分析方法汲取百家之長,從各個方面得到了完善和發展。同時情報學在完善技術和方法的同時也將會開創更多的新技術,為將來更多的研究做鋪墊,情報學專業將會在大數據時代逐步走向成熟。

3.2情報學將會更加受到重視

很多人曾經認為沒有必要設置情報學專業,甚至網絡中有人將情報學列入20個無用的專業之一。但是在大數據時代,任何一個行業想在海量數據中進行“淘金”,都需要情報工作人員的介入,事實驗證情報學的一些比較成熟的研究方法是其他專業不能比擬的,在情報學對數據挖掘的能力面前,曾經看著無用的垃圾信息將會是揭示某種規律的關鍵性信息。

情報學專業在大數據時代應該抓住機遇展現自身的優勢,順應潮流發展,讓更多的人看到情報學專業的閃光點,進一步對學科建設進行完善,使情報學充分的與數學、經濟學、心理學等其他學科結合起來,從而使情報學更為成熟,成為數據挖掘和數據分析中的領頭羊。

3.3情報學人才的培養

情報學未來開發新技術,研究新方法無疑是需要更多的人才培養,這就需要更多跨專業人才進入情報學,在招收情報學方面人才時應該更加注重人才在學科中的交叉,不同學科人才的思維方式不同,不同學科人才的專長不同,不同學科人才所了解的研究方法也是多種多樣。未來情報學要抓住大數據時代的契機,對各類人才進行吸收,從而使情報技術更為完善,使研究方法更為廣泛。同時現有的情報工作者也要注重自身的培養,與時俱進,多涉及一些其他領域的知識,使自身的研究領域得到更好的完善。  4結論

綜上所述,大數據時代為情報學帶來了很多難題,也帶來了很多技術和方法上的困難,但與此同時,大數據時代也為情報學帶來了更多的發展,機遇。本文從大數據時代背景下情報學發展趨勢和面對機遇方面出發,為情報學未來發展提出了建議,希望可以為以后的研究者提供些幫助。

參考文獻

[1]http:∥baike.baidu.com/view/6954399.htm[eb].2013,(1).

[2]what is big data[eb/ol].http:∥www-01.ibm.com/software/data/bigdata/,2013-01-16.

[3]big data in little new zealand[

eb/ol].http:∥techday.co.nz/itbrief/news/big-data-in-little-new-zealand/24518/,2013-01-16.

[4]intelligence analysis today and tomorrow[j].securitychallenges,2009,5(1):67-83.

[5]alan l.porter,scottw.cunninghan.tech mining exploiting new technologies for competitive advantage[m].john wiley & sons,2005.

[6]nsfs cyberinfrastructure vision for 21st century discovery[eb/ol].http:∥nsf.gov/od/oci/civ5.pdf,2013-01-16.

篇10

大數據,作為一種數據管理的理念和方式,其之所以出現,是云計算和物聯網等信息技術的發展,與人類社會所積累的數據高速增長并海量積累相結合的結果。無論是如何定義,從本質上,大數據是信息管理者在當今的信息技術條件下,為解決新的海量信息處理需求,所提出的解決策略。而作為典型的信息管理活動之一的檔案事業,勢必會受到大數據理念的影響。

大數據并不是一個嚴謹而完整的學術概念,其所包含的內容相對比較抽象,從字面意義上進行理解,大數據所指的是數據規模的龐大。但從這一意義上來看,顯然無法與傳統的以往一系列概念進行區別,如“海量數據”(Massive Data)、“超大規模數據”(Very Large Data)。在學術界,對于大數據的定義尚未形成統一的觀點,但綜合各種說法,主流的思路是從大數據的特征出發,通過歸納的方式,通過對特征的描述進行定義。其中最有代表性的是3V定義[1],即認為大數據需滿足3個特點:規模性(Volume)、多樣性(Variety)和高速性(Velocity)。此外在實踐層面,普遍認為大數據具有全數據規模、多數據類型、低價值密度、高處理速度的特點。

在數據管理理念層面,大數據的特點在于全數據規模、豐富的數據類型(可能包含半結構化數據)、全數據處理對象、多數據處理工具;在數據處理技術層面,大數據體現為對云計算和新一代數據庫的應用;在操作方式層面,大數據體現為對零散信息價值的重視及對數據之間相關而非因果關系的分析。

二、大數據對檔案工作帶來的機遇

(一)解決信息化背景下檔案的“脹庫”問題

近年來,隨著電子文件的理念逐步得到認可,以及檔案的單位管理成本的降低,加之人們對于歸檔保存的重要性的認識的提升,我國的檔案總量步入了一個高速增長的時期[2],但與此同時,信息化背景下的檔案數據庫脹庫問題也隨之到來了,其中較為明顯的表現為“新增數據失敗”等[3],脹庫問題帶來的,不僅僅對新增檔案管理上的難題,同樣重要的是,由于脹庫現象的出現,檔案的服務利用的效率將大打折扣,其原因在于案卷在出現脹庫的過程中,無法及時有效地歸檔并建立索引以提供服務,破壞了檔案案卷之間的連續性和關聯性,降低了檔案中所提供的信息的價值。信息化背景下檔案的“脹庫”問題,本質上在于存儲和計算資源分配的不夠合理,傳統的數據庫架構在處理新的海量數據的過程中,靈活性遠遠不夠。解決這一問題,需要求助于大數據技術框架中的云計算技術[4],利用云計算技術強大的調配計算資源的能力,根據數據處理規模的需要,配置數字化檔案管理所需要的存儲和計算資源,保證檔案的服務利用效率。

(二)有利于推動社會檔案觀的普及

大數據的核心在于從海量的數據中挖掘價值[5],這為檔案價值的進一步發現和提升,提供了一個新的思路。傳統的檔案服務利用概念中,檔案的服務利用對象是特定并且相對單一的,原因在于檔案通過卷宗的形式,將一個相對完整的信息“包裹”存留,這部分相對完整的信息最終成為了檔案卷宗的主題。而在服務利用的過程中,“主題匹配”成為了最為常見的檔案定位方式,而主要來自于政府機關、企事業單位的日常運行信息形成的檔案,其主題自然會牢牢地與其形成機關的業務活動相對應,而檔案卷宗中所包含的零散的信息價值,相對容易被忽略,如今被公眾廣泛利用的檔案,多數是民生檔案[6],而其他類型檔案中的零散信息價值,缺乏有效的挖掘服務利用手段,這是社會檔案觀在普及過程中必須解決的問題之一,即如何幫助公眾挖掘他們所關心的分散于海量檔案中的信息價值。大數據為檔案的服務利用提供了新的價值挖掘工具,使得分散在海量數據中的零散價值成為可能,這就意味借助大數據的信息分析工具,公眾將能夠從主題上看上去并不相關的眾多檔案中,發掘其自身所需要的信息,獲取相應的信息價值,將推動公眾逐漸意識到檔案作為當今社會最重要的信息價值載體之一的重要意義,而一旦這樣的意識逐步成型,檔案社會觀將得到普遍的認可。

(三)有利于處理多載體類型的檔案

信息技術的發展對于檔案管理工作的重要影響之一,就是提供了多樣化的信息載體形式,豐富了檔案的類型,從最原始的紙質載體的文書檔案,發展到如今的音像檔案、圖片等等。而隨著電子文件概念不斷獲得認可,新的信息載體形式層出不窮,從理論上講,每當出現一種新的信息載體形式,就會相對應地出現該載體形式的檔案。這就意味著未來檔案的管理工作必將是基于多載體的,其載體的豐富程度可能會遠遠超過我們的預期,而為最大程度保證原始證據價值,在技術條件允許的前提下,未來的檔案管理工作將會嘗試接受半結構化的數據作為檔案,以最大程度地保留證據價值[7]。這使得未來的檔案載體形式將呈現數量多、增長快的特點,這就要求針對具體檔案類型的管理工具,或者抽象為一類特定的數據處理工具,是無法實現“One size fit all”的,即不再存在能夠完美處理所有的檔案載體類型的管理工具。這一點上與大數據對處理多數據類型過程中所提出的數據工具組合的理念,是相一致的。未來的檔案服務利用活動,由于其面向的檔案對象的載體是多樣的,對其進行利用的工具也將是多樣的,甚至為處理一些半結構化的數據的過程中,可能會需要多種數據處理工具的組合。

(四)有利于電子文件的管理

大數據將從真實性、有效性、及時性三個方面提升電子文件的管理水平。首先從真實性角度考慮,由于電子文件驚人的增長速度,其真實性鑒定工作一直是困擾檔案工作者的難題之一,傳統的“直接鑒定法”在實際操作的過程中所消耗的人力物力成本過于巨大[8],因此鑒定文件的真實性需要求助于大數據技術處理海量數據并分析復雜數據的能力;第二,從有效性角度考慮,電子文件的結構化特征并不明顯,大量的電子文件都是半結構化甚至是非結構化的,在這種數據類型情況并不穩定的前提下,處理數據對象單一的傳統檔案管理數據庫結構是難于駕馭的,而大數據技術框架下對于多數據結構的兼容性,能夠較好地解決這一問題,提升對電子文件進行管理的有效性;第三,從及時性的角度考慮,電子文件的指數增長,使得及時地對新增檔案進行管理成為了檔案工作者所面臨的一大難題,這樣的海量數據的實時處理,是檔案管理過程中前所未有的,這需要利用大數據技術框架中通過云計算的方式提升數據處理的及時性,才能保證電子文件管理的及時性。

三、大數據背景下檔案工作的發展趨勢

(一)從數字化到數據化

為應對信息時代對于檔案工作新要求,檔案數字化的工作已經進行了多年,并在一定程度上解決了傳統檔案利用信息技術進行管理及共享的問題[9],收到了相當的成效。但在大數據時代背景下,數字化僅僅是解決了載體形式或者說是信息技術的應用問題,可以理解為檔案工作對信息技術的適應性應用,對于深入的數據挖掘與利用是遠遠不夠的。在大數據的時代背景下,信息管理者已經不再滿足于更易管理和共享的信息形式,應更為關注信息所能帶來的價值,這就要求對于檔案的管理工作框架,需要實現從數字化到數據化的轉變,即不僅僅能夠實現對檔案案卷的數字化管理,更能夠根據海量數據挖掘利用的需要,對檔案的管理深入到數據層面,這將更為適合大數據技術架構下對數據的“流處理”模式。

(二)從信息共享到信息價值共享

隨著大數據時代的到來,數據挖掘技術的應用進入了一個全新的階段,所有的信息管理者都面臨著同樣一個問題:將簡單而直接的信息共享活動轉換為更為高級的信息價值的共享,即需要對自身所掌握的信息的價值有清晰的掌握和準確的理解,對應到檔案工作者的現狀上,即檔案工作者僅僅了解自己在管理哪些檔案并提供服務利用,已經無法適應大數據時代對檔案服務利用的要求了,而需要能夠了解自己所掌握的檔案能做什么,所提供的檔案利用服務所實現的是什么功能,也就是要明確所掌握的檔案的價值。這需要對檔案利用服務的認識有更加深入的認識,在大數據時代的背景下,由于對信息價值提取效率的提升,對于信息價值的共享將成為所有信息服務利用的主流趨勢,這對檔案服務利用工作將是全新的挑戰,這不僅僅要求能夠靈活地運用大數據技術在整合檔案數據的基礎上挖掘其中蘊含的價值,更加需要檔案工作者對于信息價值有著更為敏感的“嗅覺”。

四、大數據對檔案工作帶來的挑戰

(一)如何嵌入數據挖掘環節

傳統的檔案管理活動,最為通行的說法是包含收集、整理、保管、鑒定、統計和提供利用六個主要環節,這六個環節組成了基本的檔案管理活動,并組成了一次完整的信息從收集到提供利用的過程。在大數據的時代背景下,對于檔案管理活動提出了新的要求,即主動地挖掘其中的價值并提供利用服務,這就涉及到一個流程嵌入的問題,即數據挖掘環節應該通過什么樣的方式嵌入到檔案管理活動中來,是作為一個單獨的環節嵌入到檔案的管理流程之中,還是在傳統的檔案管理活動的某一環節中實現數據挖掘的功能,直接關系到檔案管理活動流程的合理性。數據挖掘的嵌入問題,當檔案事業逐步步入電子文件時代之后,必須要解決的問題。

(二)如何保障檔案信息的安全性

大數據對于檔案信息的共享程度提出了更高的要求,只有在檔案資源高度共享的情況下,大數據技術框架下的云計算平臺才能發揮作用,真正實現檔案信息價值的利用。但隨之而來,就是檔案信息的安全性問題,如何解決在多類型、多結構、高共享程度狀態下的數據安全問題,已經顯得十分棘手。工作人員操作失誤、設備及網絡故障、計算機病毒、網絡黑客攻擊等對檔案信息安全構成威脅的因素,在大數據的技術框架下,所造成的威脅可能會被相應地放大。大數據時代的檔案信息的保密工作,其重心很有可能不再是保密體制的設計,而更有可能是信息安全技術的有效應用。