一元微积分推广到多元:
- 导数 → 偏导数 / 方向导数 / 梯度。
- 定积分 → 二重 / 三重积分 / 曲线积分 / 曲面积分。
- 微积分基本定理 → 格林公式 / 高斯公式 / 斯托克斯公式。
推广的难点在于「方向变多了」。一元函数在一点只能左右走,多元函数却能朝无穷多个方向走,于是「变化率」这件事必须先说清「沿哪个方向」——偏导数、方向导数、梯度都是为回答这个问题而生。
(x,y)→(x0,y0)limf(x,y)=A
要求 (x,y) 沿 任何路径 趋近 (x0,y0) 时极限都相同。
这是多元极限最棘手的地方:一元只有左右两条路,多元有无穷多条路(直线、抛物线、螺旋……)。只要找到两条路径让极限值不同,极限就不存在。 经典反例 f=x2+y2xy 在原点,沿 y=kx 趋近会得到随 k 变化的值 1+k2k,故极限不存在。连续的定义照旧:(x,y)→(x0,y0)limf=f(x0,y0),初等函数在定义区域内仍处处连续。
fx(x0,y0)=Δx→0limΔxf(x0+Δx,y0)−f(x0,y0)
记号:∂x∂f、fx、∂xf。
偏导的做法就一句话:对哪个变量求导,就把其余变量统统当常数。 几何上,fx(x0,y0) 是曲面 z=f(x,y) 被平面 y=y0 截出的那条曲线在该点的切线斜率——只沿 x 轴方向看曲面的陡峭程度。fy 同理沿 y 方向。
混合偏导 fxy 与 fyx 在二者连续时相等(求导次序可交换)。
例:f=x3y2+sin(xy)。对 x 求偏导时把 y 当常数:
fx=3x2y2+ycos(xy),fy=2x3y+xcos(xy)
混合偏导 fxy=∂y∂(3x2y2+ycosxy)=6x2y+cosxy−xysinxy,可验证 fyx 给出同一结果。
dz=∂x∂zdx+∂y∂zdy
全微分是用 切平面 代替曲面:函数的真实增量 Δz 约等于沿 x、y 两个方向的线性增量之和。它把一元的「切线近似」升级成「切平面近似」。
例(全微分作近似):估 (1.02)3.01。取 f(x,y)=xy、(x0,y0)=(1,3)。fx=yxy−1、fy=xylnx,在 (1,3) 处 fx=3、fy=0、f=1。于是
(1.02)3.01≈f+fxΔx+fyΔy=1+3×0.02+0×0.01=1.06
fy=0 是因为 ln1=0,所以 y 的微小变化几乎不影响结果。
可微性的逻辑链需要分清:
偏导连续⇒可微⇒{连续偏导存在
反向都不成立。特别注意 偏导存在不一定可微——偏导只管住 x、y 两个坐标方向,可微却要求切平面在 所有方向 都贴合曲面,是强得多的条件。
若 z=f(u,v),u=u(x,y),v=v(x,y):
∂x∂z=∂u∂z∂x∂u+∂v∂z∂x∂v
和一元链式法则同理,只是 x 通过 多条路径(经 u、经 v)影响 z,每条路径贡献一项,最后 求和。画一张「变量依赖图」,从 z 到 x 有几条通路就有几个加项,每条通路上的偏导相乘——这是多元求导不出错的实用技巧。
由 F(x,y)=0 确定 y=y(x):
dxdy=−FyFx
由 F(x,y,z)=0 确定 z=z(x,y):
∂x∂z=−FzFx,∂y∂z=−FzFy
这些公式由「对 F=0 两端求全微分、再解出待求偏导」得到,避免了显式解出 y 或 z。前提是分母(如 Fy、Fz)不为零,这正是 隐函数定理 保证局部能解出函数的条件。
方向导数:函数沿单位向量 l=(cosα,cosβ) 的变化率。
∂l∂f=fxcosα+fycosβ=∇f⋅l
偏导只测坐标轴方向的陡度,方向导数测 任意指定方向 的陡度——把它写成梯度与方向向量的点积,是理解梯度的钥匙。
梯度:
∇f=(∂x∂f,∂y∂f,∂z∂f)
梯度指向函数 上升最快 的方向,其模 ∣∇f∣ 是该方向的(最大)变化率。原因藏在点积里:∂l∂f=∇f⋅l=∣∇f∣cosθ,θ 是 l 与梯度的夹角。当 l 与梯度同向(θ=0)时变化率最大、反向最小、垂直时为零。所以「站在山坡上、朝梯度方向迈步爬升最快」,而 梯度处处垂直于等值线 / 等高面。这是机器学习里梯度下降法的几何根基。
例(方向导数与最大变化率):f=x2+xy+y2 在点 (1,1) 处沿 a=(3,4) 的方向导数。先求梯度 ∇f=(2x+y, x+2y),在 (1,1) 处为 (3,3)。a 的单位向量是 l=(53,54),故
∂l∂f=∇f⋅l=3⋅53+3⋅54=521
而该点变化率的最大值就是 ∣∇f∣=32+32=32,在沿梯度方向 (1,1) 时取得。
必要条件:fx=fy=0(驻点,对应切平面水平)。
充分条件用二阶偏导判别(类比一元的 f′′)。设 A=fxx,B=fxy,C=fyy,Δ=AC−B2:
| Δ>0 | Δ<0 | Δ=0 |
|---|
| A>0 极小,A<0 极大 | 非极值(鞍点) | 不定,需另判 |
Δ<0 对应 鞍点——形如马鞍,沿一个方向是谷底、沿另一方向是山顶,所以不是极值。这是多元才有的新现象,一元没有对应物。
例:求 f=x3−3xy+y3 的极值。解驻点 fx=3x2−3y=0、fy=−3x+3y2=0,即 y=x2、x=y2,得 (0,0) 与 (1,1)。二阶偏导 A=fxx=6x、B=fxy=−3、C=fyy=6y,Δ=AC−B2=36xy−9:
- 在 (0,0):Δ=−9<0,是 鞍点。
- 在 (1,1):Δ=36−9=27>0 且 A=6>0,是 极小值,f(1,1)=−1。
求 f(x,y) 在约束 g(x,y)=0 下的极值,构造 拉格朗日函数(Lagrange Function):
L(x,y,λ)=f(x,y)+λg(x,y)
令 Lx=Ly=Lλ=0 联立求解,得到候选点。
几何直觉:在约束曲线上找 f 的极值,相当于看着 f 的等高线沿约束线移动。极值出现在等高线 恰好与约束线相切 的地方——此时若再沿约束线挪一点,f 不再增减。相切意味着两条曲线的法向量平行,即 ∇f=−λ∇g,这正是拉格朗日条件。乘数 λ 衡量「放松约束一点点能让 f 改善多少」。
例:求 f=xy 在约束 x2+y2=1 下的最值。构造 L=xy+λ(x2+y2−1),令
LxLyLλ=y+2λx=0=x+2λy=0=x2+y2−1=0
前两式相除(或联立)得 y2=x2,代入约束得 x2=y2=21。于是 f=xy=±21:最大值 21(取 x=y=21),最小值 −21。联立后常用「两式相除消 λ」快速得到变量间关系,再回代约束。
∬Df(x,y)dσ
几何上是 曲顶柱体的体积:底是平面区域 D,顶是曲面 z=f(x,y)。计算思路是「切成片再累加」,化为 二次积分(先对一个变量积分、把结果再对另一个积分)。
- 直角坐标:dσ=dxdy,按 X-型或 Y-型区域定内外层积分限。选哪种次序取决于 哪种区域描述更简单,必要时交换次序。
- 极坐标:dσ=rdrdθ。当区域是圆 / 扇形、被积函数含 x2+y2 时首选。那个多出来的 r 是 面积元的拉伸因子(极坐标下小块面积是 rdrdθ,离原点越远扇环越宽)。
对称性 能大幅简化计算:若区域关于 x 轴对称、被积函数关于 y 为奇函数,则积分为 0;为偶函数则取一半区域积分再乘 2。
例(直角坐标 + 换序):∫01∫x1ey2dydx。内层 ∫ey2dy 积不出,必须 交换次序。原区域是 0≤x≤y≤1 的三角形,换成先对 x 后对 y:
∫01∫0yey2dxdy=∫01yey2dy=21ey201=2e−1
换序后内层多出的因子 y 恰好凑成 d(y2),积分迎刃而解。遇到内层积不出,优先想换序。
例(极坐标):∬De−(x2+y2)dσ,D 是圆 x2+y2≤R2。被积含 x2+y2、区域是圆,改极坐标 x2+y2=r2、dσ=rdrdθ:
∫02π∫0Re−r2rdrdθ=2π⋅[−21e−r2]0R=π(1−e−R2)
那个多出来的 r 让 e−r2r 可凑微分——这正是极坐标处理高斯型积分的妙处。
∭Ωf(x,y,z)dV
| 坐标系 | 体积元 | 适用 |
|---|
| 直角坐标 | dV=dxdydz | 长方体类区域 |
| 柱坐标 | dV=rdrdθdz | 圆柱、旋转体(绕轴对称) |
| 球坐标 | dV=ρ2sinφdρdφdθ | 球、含 x2+y2+z2 的被积函数 |
柱坐标 = 极坐标加一根 z 轴;球坐标用「到原点距离 ρ + 两个角度」定位。体积元里的 r 和 ρ2sinφ 都是坐标变换的 雅可比因子,本质是「换坐标后小体积块被拉伸了多少」。
例(柱坐标):求 ∭Ω(x2+y2)dV,Ω 是 x2+y2≤1、0≤z≤2 的圆柱。改柱坐标 x2+y2=r2、dV=rdrdθdz:
∫02π∫01∫02r2⋅rdzdrdθ=2π⋅2⋅∫01r3dr=4π⋅41=π
例(球坐标):求半径 R 的球 Ω 内 ∭Ωx2+y2+z2dV。被积是 ρ、区域是球,用球坐标 dV=ρ2sinφdρdφdθ:
∫02π∫0π∫0Rρ⋅ρ2sinφdρdφdθ=2π⋅[−cosφ]0π⋅4R4=2π⋅2⋅4R4=πR4
三个变量的积分 完全分离、各自独立积出——这是球对称问题用球坐标的最大便利。
∫Lf(x,y)ds=∫αβf(φ(t),ψ(t))φ′2+ψ′2dt
物理意义是 变密度曲线的质量:f 是线密度,沿曲线累加。它 与方向无关(弧长 ds 永远为正)。
例:算 ∫L(x2+y2)ds,L 是圆 x=cost,y=sint(0≤t≤2π)。在 L 上 x2+y2=1,弧长元 ds=(−sint)2+(cost)2dt=dt,故
∫L(x2+y2)ds=∫02π1⋅1dt=2π
∫LPdx+Qdy
物理意义是 变力沿曲线做的功:F=(P,Q) 是力场,沿路径累加力在位移方向的分量。它 与方向有关,反向取负号——逆着走,做的功反号。
例:算 ∫Lxdy−ydx,L 是从 (1,0) 沿单位圆逆时针到 (0,1)。参数化 x=cost,y=sint,t 从 0 到 2π,dx=−sintdt、dy=costdt:
∫0π/2[cost⋅cost−sint⋅(−sint)]dt=∫0π/21dt=2π
第二类曲线积分先参数化、把 dx,dy 都换成 dt,化成一元定积分。
∬Σf(x,y,z)dS
是曲线积分对弧长的升维:变密度曲面的质量,与侧无关。
∬ΣPdydz+Qdzdx+Rdxdy
物理意义是 流量 / 通量:向量场 F=(P,Q,R) 穿过曲面 Σ 的净流量。它 与侧有关,反侧取负——流入还是流出,符号相反。
这三个公式是多元微积分的顶峰,把 边界上的积分 等于 内部的积分,都是牛顿-莱布尼茨公式在高维的化身。
∮LPdx+Qdy=∬D(∂x∂Q−∂y∂P)dσ
把平面闭曲线 L 上的第二类曲线积分,换成它围住区域 D 上的二重积分。右端的 ∂x∂Q−∂y∂P 是向量场的 旋度(平面版),度量场的「打旋」程度;左端是沿边界的 环量。
例(格林公式算环量):算 ∮L(x−y)dx+xdy,L 是单位圆逆时针。这里 P=x−y、Q=x,∂x∂Q−∂y∂P=1−(−1)=2,转成二重积分:
∮L(x−y)dx+xdy=∬D2dσ=2⋅(圆面积)=2π
直接参数化也能算,但格林公式把沿边界的积分一步换成区域上常数的积分,省事得多。
格林公式还给出 用曲线积分算面积 的公式:取 P=−2y、Q=2x 使 ∂x∂Q−∂y∂P=1,则
A=21∮Lxdy−ydx只用边界信息就能求出围住的面积,是行星扫面积、求多边形面积(鞋带公式)的连续版本。
∬ΣPdydz+Qdzdx+Rdxdy=∭Ω(∂x∂P+∂y∂Q+∂z∂R)dV
把闭曲面 Σ 上的 通量,换成它围住的立体 Ω 内部 散度 的体积分。散度 ∇⋅F 度量某点是「源」(向外冒)还是「汇」(向内吸)。直觉:穿过表面的净流量,等于内部所有源汇的总和——内部冒出来的,最终都得从表面流出去。
例(高斯公式算通量):求 F=(x,y,z) 穿过半径 R 球面 Σ(外侧)的通量。散度 ∇⋅F=1+1+1=3,转成体积分:
∬Σxdydz+ydzdx+zdxdy=∭Ω3dV=3⋅34πR3=4πR3
直接在球面上算曲面积分相当麻烦,高斯公式把它化成「常数 × 体积」。遇到闭曲面通量、被积式散度简单时,首选高斯公式。
∮LPdx+Qdy+Rdz=∬Σ(∇×F)⋅dS
是格林公式的空间推广:空间闭曲线 L 上的 环量,等于以 L 为边界的曲面 Σ 上 旋度的通量。旋度 ∇×F 是个向量,指向「旋转轴」方向、模为旋转强度。
例(斯托克斯公式算环量):F=(−y,x,z),L 是平面 z=0 上的单位圆(逆时针)。旋度
∇×F=(∂y∂R−∂z∂Q, ∂z∂P−∂x∂R, ∂x∂Q−∂y∂P)=(0,0,2)
取 Σ 为 L 围住的圆盘(法向量 n=(0,0,1)),旋度通量 =∬Σ2dS=2π,即 ∮LF⋅dr=2π。先算旋度、选最简单的张曲面,再积旋度的通量。
把三大公式连同牛顿-莱布尼茨公式放在一起看,是同一个思想在不同维度的复奏:边界上的积分 = 内部某种「导数」的积分。
- 一维:∫abF′(x)dx=F(b)−F(a)(区间内部 vs 两端点)。
- 格林 / 斯托克斯:曲线环量 vs 曲面旋度。
- 高斯:曲面通量 vs 体积散度。
它们在微分形式的语言里统一为一条 广义斯托克斯公式 ∫∂Ωω=∫Ωdω。