全时财经

首页 > 期货 > 正文

作物优良率与单产相关性分析

  生长状态对于单产产出的参考作用十分有限,应全面考虑各方面的影响因素

  作物最终单产与优良率之间有没有直接的关系呢?当我们采用生长指数与大豆最终单产和趋势单产的差值来考量时,可以发现2012年极端情况下,二者之间的相关性比较明显。若今年的优良率维持在57%,则意味着单产最终很可能会高于47蒲/英亩,平衡表上美豆的供需结构仍然是非常宽松的,从基金的角度来说,并不具备作为多头配置的条件——也就是说价格仍将继续在低位振荡,8月产量明朗前后价格将会再次探底。

  在预估玉米和大豆单产量时,优良率作为重要的考量标准,常常出现于各类模型当中。然而优良率和单产的相关性分析一直存在着较大分歧。这一方面由于样本采集过程中不可避免会存在偏差,另一方面在于优良率的判断过程存在较多的主观性。不难发现,由于影响因素复杂多变,优良率在作物成长的不同阶段很难按照一定规律进行调整,这就进一步降低了优良率作为单产指标的准确性。

  在玉米和大豆种植过程中,尤其是前期阶段,由于各种干扰因素尚不明显,优良率往往无法直接指向单产量。然而随着种植阶段靠近后期,各类因子的作用慢慢成型,不确定因素逐步消失,优良率也调整到一个更加具有说服力的水平。

  我们选取1995年至2016年间优良率和单产数据进行对比,以分析其中是否存在足以说明问题的相关联系。

  优良率与单产量回归对比

  在进行数据处理分析时,我们通常容易陷入一个误区,对于有着相近走势的样本往往判断其存在较强相关性,而这种估计方式是有失偏颇的。

  我们对1995年至2016年的玉米和大豆的平均优良率和单产数据进行整理分析,以了解两者之间的整体关系。从趋势来看,两者的走势十分相似,呈现较一致的波动状态,然而在对两组数据进行线性回归后,得出结果显示,玉米的拟合度仅为37.84%,大豆为38.13%,优良率对于单产产量的说明力度尚不足四成。

  而鉴于2012年的极端天气,我们在剔除异常值后再次对样本进行回归,玉米的拟合度反而出现下滑至33.32%,而大豆的拟合度有较明显回升至55.61%。剔除异常值并不能明显提高优良率的说明力度,而异常值的存在,同样也说明优良率作为指向性指标存在着误差。

  图为玉米生产季内平均优良率与单产相关性

  图为玉米生产季内平均优良率与单产趋势对比

  在生长前期的散点图中不难发现,产品的优良率与单产离散程度非常高,且数据大量聚集于分布的右半部分。我们选取了7月中的数据作为例证,在这段期间,玉米优良率和单产的拟合度仅为20.9%,而大豆的拟合度几乎为0,说明玉米和大豆前期的优良率完全无法指向单产的高低。

  图为大豆7月中优良率与单产相关性

  图为大豆7月中优良率与单产趋势对比

  大豆和玉米的生长季一般结束于每年的10月中上旬,这个时候,由于生长期间各种不确定因子(天气、技术、环境等)逐渐确定下来,数据所受到的干扰性也开始下降,优良率对于单产水平的指向性逐步突显出来。通过回归我们发现优良率水平在一定程度上说明了单产量,玉米的拟合度上升至40.13%,大豆的拟合度更是达到了61.34%。

  图为玉米生长季末优良率与单产相关性

  图为玉米生长季末优良率与单产趋势对比

  然而还需要强调的是,相关性不等同于因果性。并没有足够的理论依据证明优良率低将导致单产降低。如前面提到的2012年的异常值,我们发现尽管当年的玉米优良率仅为25%,但单产依旧保持在123.1蒲式耳/英亩的正常范围内。另一方面,尽管10月优良率与单产之间的拟合度上升,但事实上到10月单产几乎已经确定,并不需要使用优良率来作为单产高低的参考指标,对行情的影响或者说指导意义就更加微弱。

  优良率各期较期末偏离度问题

  由于生长阶段末期优良率与单产产量相关性更高,所以不同阶段的优良率相对于末期优良率的偏离度也具有一定的说明性。

  我们选取了玉米和大豆生长阶段刚刚开始时的优良率算出其较末期优良率之间的差值以及差值的期望,发现种植初期数据整体来看对于优良率水平有所高估,玉米的平均偏离水平为6.05%,大豆的平均偏离水平为8.91%。而就偏离程度的分布来看,并不存在一定的规律性与相关性,表现为随机分布。

  图为玉米生长季初期末期优良率差值

  图为大豆生长季初期末期优良率差值

  加入趋势单产考量后的回归分析

  随着科技的发展和种植方式的改变,单产产量整体呈现一个上升的趋势,而优良率则基本维持在相近的水平上。所以在进行分析预测的过程中,我们将趋势单产纳入考量范围,剔除掉两者因为增速不同所带来的干扰。另外,在评估作物的生长时,仅仅采用优良率不足以反映产品的整体状态,所以我们分别给五个级别的生长状况(非常不好、不好、一般、好、很好)以100—500进行权重赋值,得到一个位于(100,500)区间的综合评分。相较于优良率,这个评分会更加全面和系统。

  我们用趋势单产和实际单产的差值作为因变量,来与大豆生长状态评分重新进行回归。这里我们选取了7月第三周和8月初的评分作为参照标准,主要在于这个阶段是大豆的开花结荚期,此时的生长状态有着较强的研究价值。

  图为大豆生长状态和实际/趋势单产差值回归(7月第三周)

  图为大豆生长状态和实际/趋势单产差值回归(8月初)

  通过分析生长指数与实际单产-趋势单产差值之间相关性,我们观察到除了2012年的特殊情况外,数据基本都落在了95%的置信区间内,说明这里回归出的结果是有效并具有一定参照性的。当然需要提醒的是,这只是在统计上有效,对于实际单产与趋势单产差值来说,落在置信区间内的任何一个位置都是允许的,这就有可能导致实际单产的可能区间会很大,对行情的影响也就会截然不同了。

  根据7月24日USDA发布的大豆生长状况数据,我们算出当前大豆评分为386,在假设7月回归出的模型有效的前提下可得差值为-0.33,已知当前的趋势单产为48,则预测未来单产会下降至47.67左右。然而今年7月以来,受限于降雨偏少,大豆生长状态的评分一直呈现下滑趋势,每周在两个百分点左右。假设下滑趋势得不到改善,那么单产大概率会降至47以下。我们分析了过去20年中和今年前七周走势相近的几年的优良率数据,发现基本下降趋势会在第十周企稳并小幅回升,按照这个趋势,依照8月的回归模型,预计今年单产最终会在46.7—47.5蒲式耳/英亩之间。7月31日的优良率已经有所回升,若这一趋势维持,预计实际单产很可能在47.4±0.4蒲/英亩之间。

  结论

  我们在前文中分析了作物各个阶段的优良率和单产的相关关系,并结合了期初期末优良率的偏离量和趋势单产的影响后,得出的结论均显示,作物生长状态对于作物单产产出的参考作用是十分有限的。作物的生长状态,尤其是前期的数据并不足以反映单产水平,所以在进行分析时不能仅仅依赖当期优良率或作物状态评分的高低,更应该全面考虑各方面的影响因素。

  加入趋势单产考量后,发现生长指数与实际单产-趋势单产差值之间的相关关系基本在95%的置信区间内,结果具有一定参考性。基于大豆当前的生长状况,预计实际单产很可能在47.4±0.4蒲/英亩之间。

  (作者单位:广发期货)

本站部分文章来源于网络,版权属于原作者所有;如有转载或引用文章/图片涉及版权问题,请联系我们处理!

相关推荐