漫步数学分析三十六——泰勒定理

我们讨论一般函数 f:A?Rn→Rm 的泰勒公式,为此我们首先讨论高阶导数。对于 f:Rn→R ,定义高阶偏导没有问题;我们仅仅迭代偏导的过程

?2f?x1?x2=??x1(??x2f)
然而,将导数看做线性映射时需要非常小心。
如果二阶导存在的话,可以通过对 Df 求导获得,过程如下。
定义4令 L(Rn,Rm) 表示从 Rn 到 Rm 的线性映射空间,(如果我们在 Rn , Rm 中选择一个基,那么 L(Rn,Rm) 等同于 m×n 矩阵)接下里 Df:A→L(Rn,Rm) ;即对每个 x∈A 我们得到一个线性映射 Df(x0) 。如果我们在 x0 处对 Df 求导,我们就得到从 Rn 到 L(Rn,Rm) 的线性映射,写作 D(Df(x0))=D2f(x0) 。我们将 Bx0:Rn×Rn→Rm 定义成 Bx0(x1,x2)=[D2f(x0)(x1)](x2)
因为 D2f(x0):Rn→L(Rn,Rm) ,上面的定义讲得通,所以 D2f(x0)(x1)∈L(Rn,Rm) ;因此它能够用到 x2 上。我们这么做的原因是 Bx0 避免不必要的使用较难的空间 L(Rn,Rm)≈Rnm 。
根据定义,双线性(bilinear)映射 B:E×F→G ,其中 E,F,G是向量空间,就是每个变量都是线性的映射;例如对第一个变量,也就是说 B(αe1+βe2,f)=αB(e1,f)+βB(e2,f) ,其中 e1,e2∈E,f∈F,α,β∈R ,上面定义的映射 Bx0 很容易看成 Rn×Rn→Rm 的一个双线性映射。
接下来,对于双线性映射 B:E×F→R ,我们可以将每个 E 的基 e1,…,en 和 F 的 f1,…,fm 与一个矩阵关联起来,即令

aij=B(ei,fj)
那么如果

x=∑i=1nxieiy=∑j=1myjfj
我们有

B(x,y)=∑ijaijxiyj=(x1,x2,…,xn)????????a11???an1?a1m???anm????????????????y1???ym????????
注意:对于二阶导数,双线性映射 Bx0 在 x0 处对 Df 的求导依然写成 D2(f) 。
定理8令 f:A?Rn→R 在开集 A 上二阶可导,那么 D2f(x):Rn×Rn→R 对于标准基的矩阵为

??????????????2f?x1?x1????2f?xn?x1???2f?x1?xn????2f?xn?xn?????????????
其中每个偏微分都是在点 x=(x1,…,xn) 处进行计算。
对于高阶微分,使用相似的处理过程。例如 D3f 对每个 x给出一个三线性映射 D3(f):Rn×Rn×Rn→Rm ,我们没有将这个映射与矩阵联系起来,而是用三个标记的量来表示;对于每个元素 fk 来说就是 ?3fk(?xl?xj?xi)(这样的量叫张量(tensor))。
在处理泰勒定义之前,我们首先给出二阶导数一个非常重要的性质:定理8中的矩阵是对称的,即

?2f?xi?xj=?2f?xj?xi
定理9令 f:A→R 在开集 A 上二阶可导且 D2f 连续(即函数 ?2f/(?xi?j) 是连续的),那么 D2f 是对称的;即

D2f(x)(x1,x2)=D2f(x)(x2,x1)
或者用元素的方式表示就是

?2f?xi?xj=?2f?xj?xi
从上面的定理可以看出,在相似的条件下,高阶微分也是对称的,对于 f:A→Rm 来说,我们可以将上面的定理应用到 f 的元素上得出微分。
二阶微分的对称性是基本性质,但在单标量微积分中不存在这种情况,现在我们通过实例来验证这些原则。
假设 f(x,y,z)=exysinx+x2y4cos2z ,所以 f:R3→R ,那么

?f?x?f?y=exycosx+yexysinx+2xy4cos2z=xexysinx+4x2y3cos2z
并且

?f?y?x=xexycosx+exysinx+xyexysinx+8xy3cos2z
这与 ?2f/?x?y 是一样的。
定理9直观上不太明显,然而可以从证明中得出一些直观信息。
定义5如果一个函数的前 r 阶导数存在且连续,那么我们称该函数是 Cr 类(class)。(等价的,这意味着到 r 阶之间的所有导数均存在且连续)如果函数对于所有正整数 r 都是 Cr 类,那么我们称该函数是光滑的(smooth)或是 C∞ 类。
【漫步数学分析三十六——泰勒定理】利用定理5(坐标形式是最简单的)中的公式,我们可以说明 Cr 的复合函数还是 Cr 。
泰勒定理如下所述:
定理10对开集 A?Rn ,令 f:A→R 是 Cr 类,令 x,y∈A 并且假设连接 x,y 的线段位于 A 中,那么在这条线段上存在点 c 使得

f(y)?f(x)=∑k=1r?11k!Dkf(x)(y?x,…,y?x)+1r!Dr(c)(y?x,…,y?x)
其中 Dkf(x)(y?x,…,y?x) 表示 k 线性映射 Dkf(x) 作用到 k元 (y?x,…,y?x) 上,在坐标中

Dkf(x)(y?x,…,y?x)=∑i1,…,ik=1n(?kf?xi1??xik)(yi1?xxi)?(yik?xik)
令 y=x+h ,我们可以将泰勒公式重新写成

f(x+h)=f(x)+Df(x)?h+?+1(r?1)!Dr?1f(x)?(h,…,h)+Rr?1(x,h)
其中 Rr?1(x,h) 是余项(remainder),进一步

当h→0时Rr?1(x,h)∥h∥r?1→0
余项还有其他的表示形式,我们会在证明中给出来,这个定理是均值定理( r=1 的情况)的推广,也是单元微积分中泰勒定理的推广。
根据泰勒定理,我们可以写出 x0 的泰勒级数(Taylor series)

∑k=0∞1k!Dkf(x0)(x?x0,…,x?x0)
即便 f 是 C∞ ,它也没必要收敛,如果它在 x0 的邻域内收敛,那么我们说 f 在 x0 处是可解析的。为了说明 f 是可解析的,我们需要展示在 r→∞ 时,余项 (1/r!)Drf(c)(x?x0,…,x?x0)→0 ,那么它就能用来建立常见的幂级数表达式,像 sinx,cosx 等等。
例1: 对函数 f(x,y)=yx2(cosy2) ,验证定理9。
解:

?f?x=2xycosy2,?2f?y?x=2xcosy2?4xy2siny2

?f?y=x2cosy2?2y2x2siny2,?2f?x?y=2xcosy2?4y2xsiny2
例2: 如果 f 是 R 上的 C∞ 且对于每个区间 [a,b] ,存在常数 M 使得对每个 n,x∈[a,b] ,不等式 |fn(x)|≤M 成立,说明 f 在每个 x0 处可解析并且

f(x)=∑n=0∞f(n)(x0)n!(x?x0)n
解: 余项是

∣∣∣∑n=0∞f(n)(x0)n!(x?x0)n∣∣∣≤Mn|x?x0|nn!
当 n→∞ 时余项 →0 ,因为利用比率测试,对应的级数收敛。通过观察可知这个收敛在所有有界区间上是一致收敛的。
例3: 给出一个是 C∞ 函数但是不可解析。
解: 令

f(x)={0,e?1/x,x≤0x>0
f 平滑性唯一有问题的地方就是 x=0 处,但是对于 x>0

f′(x)=1x2e?1/x
当 x→0+ 时导数 →0 (利用洛必达法则),同样的我们可以看出 x→0+ 时 f(n)(x)→0 ,从而利用均值定理我们可以看出 f 在0处是 C∞ 且 f(n)(0)=0 ,因此 x=0 处的泰勒级数等于零,所以 f 不等于 x=0 处泰勒级数,故 f 不是可解析的。
例4: 计算 f(x,y)=sin(x+2y) 在 (0,0) 周围的二阶泰勒公式。
解: 这里 f(0,0)=0 ,

?f?x(0,0)?f?y(0,0)?2f?x2(0,0)?2f?y2(0,0)?2f?x?y(0,0)=cos(0+2?0)=1,=2cos(0+2?0)=2,=0,=0,=0
从而

f(h,k)=h+2k+R2(h,k),(0,0)
其中

当(h,k)→(0,0)时,R2(h,k),(0,0)/|(h,k)|2→0

    推荐阅读