
農(nóng)業(yè)跟大數(shù)據(jù)怎么掛鉤_數(shù)據(jù)分析師培訓(xùn)
幾千年前,農(nóng)業(yè)開始時是一種高度地點特異性的活動。第一代的農(nóng)民是培植個別植物的園丁。他們會去尋找適合這些植物的小氣候及小塊的土地。但是,隨著農(nóng)民取得科學(xué)知識及機械專門知識,他們利用了標(biāo)準(zhǔn)化的方法,如耕土、散布動物糞便作為肥料、每年輪替作物,以擴大土地,從而提高產(chǎn)量。經(jīng)過幾個年代,他們開發(fā)了較好的方法,預(yù)備土地,保護植物不被昆蟲破壞,最終也發(fā)明了機器,以減少所需要的人力。19世紀(jì)開始,科學(xué)家發(fā)明了化學(xué)農(nóng)藥,又利用新發(fā)現(xiàn)的基因原理,選擇更高效的植物。雖然這些方法將整體的生產(chǎn)力最大化,但是它們也造成了田地里某些區(qū)域的表現(xiàn)欠佳。盡管如此,產(chǎn)量還是升到曾經(jīng)不可思議的程度:有些作物的產(chǎn)量從19世紀(jì)到現(xiàn)在,增加了整10倍。
但是,今天,邁向更統(tǒng)一的做法的趨勢已經(jīng)開始反轉(zhuǎn),這多虧了“精準(zhǔn)農(nóng)業(yè)“。農(nóng)民現(xiàn)在能利用信息技術(shù),收集關(guān)于他們的田地的精確數(shù)據(jù),又能制定如何培植每一平方英尺的土地。
其中一個影響就在產(chǎn)量上面:精準(zhǔn)農(nóng)業(yè)讓農(nóng)民能從每一顆種子提取最高的價值。這么做,應(yīng)該能幫助養(yǎng)活全球的人口,總數(shù)經(jīng)聯(lián)合國估計,2050年之前將達到96億。精準(zhǔn)農(nóng)業(yè)有望能減少農(nóng)業(yè)對環(huán)境的影響,因為它能減少浪費、節(jié)約能源。它的影響力不局限于生產(chǎn)一年生作物,如小麥及玉米。它也有潛力革新人們?nèi)绾伪O(jiān)控與管理葡萄園、果園、牲畜以及森林。它或許會有一天甚至讓農(nóng)民能依靠機器人為個別植物進行評估、施肥、澆水,從而消除了農(nóng)業(yè)自發(fā)明以來所帶來的苦差事。
一步一畝地
美國政府在1983年宣布將美國軍方開發(fā)的衛(wèi)星導(dǎo)航系統(tǒng),即全球定位系統(tǒng)(GPS),開放給平民使用的時候,鋪下了精準(zhǔn)農(nóng)業(yè)原來的基礎(chǔ)。不久之后,企業(yè)開始開發(fā)”可變速率技術(shù)”,讓農(nóng)民以不同的速度為田地施肥。農(nóng)民將土地的種種特征(如酸度、磷和鉀含量)測量并加以制圖,然后對照需求而施肥。大致上,就連今天,田地還是以人工探測。過程需要農(nóng)民本身或職員在預(yù)定位置采取樣本,將之裝袋,并送往化驗室進行分析。之后,一位農(nóng)學(xué)家會制作地圖,標(biāo)示每個區(qū)域相應(yīng)的所需肥料,以優(yōu)化生產(chǎn)。最后,一臺連接GPS的肥料撒布器就會在每個地點依照所選擇的肥料量進行施肥。
超過六成的美國農(nóng)業(yè)投入品經(jīng)銷商有提供某種形式的可變速率技術(shù)服務(wù),但是美國農(nóng)業(yè)部的數(shù)據(jù)顯示,盡管有了多年來所提供的補貼及教育工作,少過20%的玉米種植面積正利用此科技管理。目前,其中一個主要的限制是經(jīng)濟。人工泥土測試昂貴,因此,那些有利用可變速率技術(shù)的農(nóng)民與農(nóng)業(yè)企業(yè),往往使用稀疏采樣策略。比方說,美國大多數(shù)農(nóng)民每2.5英畝采取一個樣本;巴西方面為每12.5英畝采取一個樣本。但是,這么做的問題是:一英畝之內(nèi)的泥土差別時常很大,而且農(nóng)業(yè)科學(xué)家同意,每英畝要采取樣本幾次,才能測出差別。換言之,農(nóng)民在田地的某些區(qū)域忽略了提高生產(chǎn)力,又在田地的其他區(qū)域施太多的肥料及其他投入品。
調(diào)查人員已開始著手處理這個問題。他們開發(fā)了廉價的傳感器,讓農(nóng)民提高他們的采樣密度。舉例說明,一種新的酸度傳感器每幾英尺就將電極插入泥土,以采取讀數(shù),并記錄其GPS坐標(biāo);以那樣的密度進行人工采樣將會太過昂貴。但是這種傳感器還沒來到大多數(shù)的農(nóng)場。有些不夠可靠,用了幾英畝就壞了;又有其他的不夠準(zhǔn)確。但是世界各地的幾個研究小組正在努力開發(fā)更牢靠的傳感器。
比較實用的,就是能夠探測植物顏色以決定其營養(yǎng)需求的傳感器。例如,缺乏氮的植物會呈淡綠色或黃色,而氮充足的植物會呈深綠色。幾家歐美公司已經(jīng)開發(fā)能夠探測綠色深度的傳感器,以便產(chǎn)生測量,可用來產(chǎn)生地圖,推薦各區(qū)域之后所應(yīng)施的氮量。另外,這些測量可以直接和氮敷料器連接,以便同時更改施肥速度。一個拖拉機可以在前面裝置傳感器,在后面裝置敷料器;當(dāng)敷料器經(jīng)過早前傳感器經(jīng)過的位置的時候,電腦就已經(jīng)通過算法計算出應(yīng)該使用的肥料量。這方面的研究由于只局限于小雜糧,如小麥、大麥、黑麥和燕麥,因此這種科技只適用于歐美種植這類作物的地區(qū)。根據(jù)普渡大學(xué)2013年的一份調(diào)查,只有7%的農(nóng)業(yè)投入品經(jīng)銷商提供植物顏色傳感器。但是,鑒于這個領(lǐng)域的初創(chuàng)公司的數(shù)量,很明顯地,許多投資者視這種科技為一個潛在的金礦。
田地與產(chǎn)量
政府開放GPS的決定,也使另一種革新性的科技誕生:產(chǎn)量監(jiān)控。歐美絕大多數(shù)的收割機已經(jīng)裝有特別的傳感器,能測量所收割的糧的流量。一個專用于該種作物的算法將數(shù)據(jù)轉(zhuǎn)換成一個常用的單位,如每英畝蒲式耳,或每公頃公斤。這些資料就會以七彩的地圖呈現(xiàn),顯示出田地各區(qū)域的變化。
這些地圖已經(jīng)成為農(nóng)業(yè)雜志及貿(mào)易展覽不可或缺的內(nèi)容,而且有很好的理由:它們讓農(nóng)民對生產(chǎn)技術(shù)、天氣狀況及泥土種類的影響有了史無前例的洞察力。這樣的地圖能讓農(nóng)民得到產(chǎn)量數(shù)據(jù),能用于保險或政府計劃,測量基因改造作物的特性或各種耕種做法的效用,以及挑出田地的哪些區(qū)域沒能盡其所能。在美國東部,農(nóng)民只有通過產(chǎn)量監(jiān)控,才得以說服地主,說明他們和洪水有關(guān)的作物損失不只局限于被水淹沒的區(qū)域,而是也包括了那些區(qū)域周圍的一圈地區(qū)。農(nóng)民的應(yīng)對,就是裝置了更多的地下排水系統(tǒng)。在阿根廷,這種科技已經(jīng)起飛,因為那里的大農(nóng)場的管理者很少像美國的同行一樣親自操作器材,這是由于當(dāng)?shù)氐耐恋厮袡?quán)的特殊歷史。對他們來說,產(chǎn)量地圖提供了他們之前得不到的關(guān)于生產(chǎn)力的實地洞察力。
但是,論數(shù)據(jù)的準(zhǔn)確性的話,產(chǎn)量監(jiān)控還有更長遠的路要走。將流量數(shù)據(jù)轉(zhuǎn)換成體積或重量測量的算法,必須每年依個別作物與農(nóng)場校準(zhǔn),而許多農(nóng)民并沒有這么做。數(shù)據(jù)也會被其它特質(zhì)所影響,如駕駛收割機的速度。雖然研究調(diào)查可以嚴(yán)格地分析產(chǎn)量監(jiān)控所得來的數(shù)據(jù),農(nóng)場及農(nóng)業(yè)企業(yè)通常會缺乏所需的統(tǒng)計技能與軟件。產(chǎn)量監(jiān)控的下一步,就是讓農(nóng)業(yè)企業(yè)采用研究者目前所使用的統(tǒng)計技巧。既然他們所發(fā)現(xiàn)的知識會使用于上百萬英畝地,他們應(yīng)該會有理由花這筆錢。
通過電線耕田
精準(zhǔn)農(nóng)業(yè)科技最常見的用途是利用GPS引導(dǎo)拖拉機。以人力駕駛農(nóng)場器材需要已受訓(xùn)的操作人員,而且工作相當(dāng)累人。就算是最好的駕駛員,也會為了避免省略田地的部分區(qū)域而交疊路線最多10%。90年代末期見證了LED燈條的采用。每個燈條是裝入一英尺長的塑料盒的一系列LED燈泡。此燈條裝置于拖拉機、收割機或其它車輛前面。若中間的燈亮起,器材就正在航道中;若左邊或右邊的燈亮起,駕駛員就必須調(diào)整操舵。
越來越多農(nóng)民將這種科技帶到下一步,就是將燈條換成自動導(dǎo)航系統(tǒng),把GPS的數(shù)據(jù)直接傳給器材的操舵機制。雖然還是要有操作員坐在機器里,它大致上還能無人駕駛。這種科技最先于90年代在澳洲廣泛使用。在那里,富含粘土的泥土,加上缺少冷凍解凍循環(huán),使田地特別容易被有輪機器擠壓。澳洲農(nóng)場利用GPS自動導(dǎo)航,將機器交通限制于狹窄的通道,因而避免其余的泥土被壓實。今天,在美國,有大約四成的肥料及其他農(nóng)業(yè)化學(xué)物質(zhì)是利用自動導(dǎo)航加以施用。
這種系統(tǒng)已經(jīng)造成好幾種副產(chǎn)品的開發(fā)。其中一種是能夠追蹤拖拉機的航道的機制。當(dāng)拖拉機經(jīng)過已經(jīng)被處理過或者環(huán)境較敏感的區(qū)域時,就會自動關(guān)閉其播種及噴灑化學(xué)物的功能。這種科技尤其有用于形狀奇特的田地,因為它們很容易被過度播種或過度噴灑。
但是,地理空間數(shù)據(jù)不單是用于以直線耕田。美國航空航天局以及其外國同行這幾十年來,都在呼吁農(nóng)民利用它們的衛(wèi)星圖像。加上了空中攝影,這些圖像成為“地理信息系統(tǒng)”的依據(jù),讓農(nóng)民儲存并分析空間數(shù)據(jù)。這種科技在有多年數(shù)據(jù)的地區(qū)特別適用,因為它讓農(nóng)民將田地分成不同的區(qū)域,以接受不同的種子、肥料及農(nóng)藥。
有些農(nóng)場的管理者甚至利用GPS來觀察田里的職員,尤其是在前蘇聯(lián),特別是在烏克蘭。當(dāng)?shù)刈畲蟮脑S多農(nóng)場面積超過10萬英畝,而且往往依靠受雇人員而非業(yè)主運營商,因此農(nóng)場管理者喜歡即時追蹤田里的所有營運活動。例如,當(dāng)一輛拖拉機停頓超過幾分鐘,總公司就會注意到,并且能致電駕駛員,詢問有什么問題。這種追蹤科技也讓管理者取締那些將公司的機器用于自己的田地的職員。
夢想中的收成
精準(zhǔn)農(nóng)業(yè)已經(jīng)將最古老的行業(yè)之一變成最高科技的之一,但是好戲還在后頭。下一步或許會牽涉到“大數(shù)據(jù)”。農(nóng)民與農(nóng)業(yè)企業(yè)已經(jīng)逐漸地在考慮如何利用他們所收藏的大量數(shù)據(jù)來增加盈利、使農(nóng)業(yè)更加可持續(xù)。例如,農(nóng)業(yè)巨頭孟山都(Monsanto)在2013年收購了氣候公司(Climate Corporation)。后者是一家兩名前谷歌職員創(chuàng)辦的初創(chuàng)公司,他們利用天氣和泥土的數(shù)據(jù)來為農(nóng)民制作保險計劃,以及推薦某塊地最適合種植哪些作物。另一個大數(shù)據(jù)能容易做到的事,就是它可幫助進行關(guān)于如何利用器材的研究。舉例說明,拖拉機種植玉米時應(yīng)該以什么速度駕駛,目前還不清楚。速度太慢,造成過程不夠效率;速度太快,造成種植不均勻,影響產(chǎn)量。但是,如果收集了關(guān)于拖拉機的速度、作物的最終產(chǎn)量及其他因素,就能計算出種植的最佳速度。
要利用大數(shù)據(jù)的力量,多家企業(yè)或許要綜合各農(nóng)場的數(shù)據(jù)。在歐美,個別農(nóng)場太小,無法產(chǎn)生足夠的數(shù)據(jù)量;就連拉丁美洲和前蘇聯(lián)的超大農(nóng)場,也會因為和隔鄰的農(nóng)場共享數(shù)據(jù)而獲益。但是,目前的問題是,農(nóng)民沒有動機去收集高品質(zhì)的數(shù)據(jù)。在美國,有些初創(chuàng)公司試圖獎勵農(nóng)民以換取數(shù)據(jù),但成效不大。迄今,能夠收集最多數(shù)據(jù)的組織是農(nóng)業(yè)投入供應(yīng)商及農(nóng)業(yè)合作社,但是,連他們的數(shù)據(jù)庫還是相對地小。
這些大數(shù)據(jù)一部分可能會來自無人機。美國大致上已從阿富汗和伊拉克撤退,因此有些軍事硬件供應(yīng)商已經(jīng)把注意力轉(zhuǎn)向農(nóng)業(yè)市場。此舉或許聰明:小型無人機可以定期拍攝作物的圖像,以指導(dǎo)灌溉、農(nóng)藥施用及收割。無人機基本上也不受云層影響,不像衛(wèi)星一樣。鑒于無人機所需要的操作費用及專業(yè)知識,無人機將最有可能最先以商業(yè)性質(zhì)使用于高價值作物上,如酒用葡萄。在美國,聯(lián)邦航空管理局也必須開放天空讓商業(yè)無人機使用。
能夠真正改造我們所熟悉的農(nóng)業(yè)的科技就是機器人學(xué)。GPS導(dǎo)航的快速采用,為更自主的農(nóng)場器材打開了大門,而且大多數(shù)的主要制造商已經(jīng)測試了他們的拖拉機的無駕駛員版本。一旦駕駛員被排除在外,一臺器材的設(shè)計標(biāo)準(zhǔn)就有了巨大的變化:它可以變得更小。我們有可能想象農(nóng)場充滿了幾百臺自主的小機器人,進行從播種到收成的各種任務(wù)。機器人可以不斷探測田地,在害蟲與疾病問題的初期將它辨認(rèn)出來。它們可以對準(zhǔn)個別的昆蟲或病株施用微量的農(nóng)藥。它們可以有效率地管理小而形狀奇特的田地,像美國東部常見的田地那樣。這樣的田地難以利用傳統(tǒng)的人類操作器材有利地耕種。在美國,機器人通過減少對墨西哥勞工的需求,甚至可能影響移民政策。
一旦涉及到新興的技術(shù)時,要選擇贏家是不可能的事。但是農(nóng)業(yè)在20世紀(jì)的歷史為它的未來提供了一些線索。20世紀(jì)中絕大多數(shù)被廣泛采用的農(nóng)業(yè)技術(shù),都具有經(jīng)濟學(xué)家稱為“體現(xiàn)知識”的特性,意思是科學(xué)的進步包含在它們之內(nèi)。農(nóng)民不需要知道農(nóng)藥如何殺蟲,或者汽油拖拉機如何操作;他們只需要知道如何噴農(nóng)藥、駕駛車輛。
相同地,精準(zhǔn)農(nóng)業(yè)的工具必須先以易用的形式發(fā)售,才能得到廣泛使用。這就是為什么GPS導(dǎo)航已經(jīng)變得那么廣泛;農(nóng)民不需要知道理解它,也能利用它。舉例說明,當(dāng)肥料的可變速率技術(shù)能做到農(nóng)夫按一個按鈕就能啟動的時候,它就會起飛。最終,精準(zhǔn)農(nóng)業(yè)可能將人類從整個過程中完全除去。一旦發(fā)生了,世界不只會看到生產(chǎn)力大幅度增長,也會看到農(nóng)業(yè)歷史上根本的轉(zhuǎn)移:沒有農(nóng)民的農(nóng)業(yè)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11