Optimal step size

We know how to compute $p^{(k + 1)}$ . We can now calculate the optimal step sizes $μ_{k + 1}$ using the orthogonality relations.

Recall the basic definitions:

Δ x^{(k)} = μ_{k + 1} p^{(k + 1)} x^{(k + 1)} - x^{(k)} = μ_{k + 1} p^{(k + 1)}

Multiply by $A$

A x^{(k + 1)} - A x^{(k)} = μ_{k + 1} A p^{(k + 1)}

We use the definition of the residual: $r^{(k)} = b - A x^{(k)}$ . So we get:

- r^{(k + 1)} + r^{(k)} = μ_{k + 1} A p^{(k + 1)}

Recall that $r^{(k + 1)} ⊥ p^{(k + 1)}$ . Let’s multiply by $(p^{(k + 1)})^{T}$ to the left:

0 + (p^{(k + 1)})^{T} r^{(k)} = μ_{k + 1} (p^{(k + 1)})^{T} A p^{(k + 1)} μ_{k + 1} = \frac{( p ^{(k + 1)} ) ^{T} r ^{(k)}}{( p ^{(k + 1)} ) ^{T} A p ^{(k + 1)}}

We can simplify it a bit more using our three-term recurrence:

p^{(k + 1)} = r^{(k)} + τ_{k} p^{(k)}, and r^{(k)} ⊥ p^{(k)} .

Take a dot product with $r^{(k)}$ :

[r^{(k)}]^{T} p^{(k + 1)} = ∥ r^{(k)} ∥_{2}^{2} + τ_{k} 0

We have proved that:

Theorem. The optimal step-size in CG is given by:

Δ x^{(k)} = x^{(k + 1)} - x^{(k)} = μ_{k + 1} p^{(k + 1)} μ_{k + 1} = \frac{∥ r ^{(k)} ∥ _{2}^{2}}{( p ^{(k + 1)} ) ^{T} A p ^{(k + 1)}}

📓 CME 302