bildverarbeitung-etit-cheat.../main.typ

360 lines
8.9 KiB
Plaintext
Raw Normal View History

2024-08-15 02:33:18 +02:00
#show link: it => [#text(blue)[#underline[#it]]]
2024-08-05 16:59:57 +02:00
#set page(
header: [
Bildverarbeitung
2024-08-15 02:33:18 +02:00
#h(1fr)
#link("https://source.orangerot.dev/University/bildverarbeitung-etit-cheatsheet", [Gero Beckmann])
2024-08-05 16:59:57 +02:00
]
)
#set heading(numbering: "1.1")
#show heading: it => [
Aufgabe #counter(heading).display(): #it.body
]
= Allgemeine Fragen #h(1fr) (20 P)
2024-08-15 02:33:18 +02:00
Wie viele Dimensionen hat eine Farbvalenz? Woher kommt die Repräsentation?
2024-08-05 16:59:57 +02:00
Was sind metamere Farbreize?
2024-08-15 02:33:18 +02:00
Welcher Farbraum eignet sich zur Farbabstandsmessung?
2024-08-05 16:59:57 +02:00
*Abtasttheorem nach Shannon*
$f_max$ bandbegrenztes Signal aus einer Folge von äquidistanten Abtastwerten
exakt rekonstruiert werden kann, wenn es mit einer Frequenz von größer gleich
$2 dot f_max$ abgetastet wurde.
== Lochkamera
#grid(
columns: (1fr, 1fr),
[
#emph([Vorteile])
2024-08-15 02:33:18 +02:00
- unendliche Schärfentiefe/dünnes Loch (theoretisch)
2024-08-05 16:59:57 +02:00
],
[
#emph([Nachteile])
- wenig Licht zum Sensor; lange Belichtung
2024-08-15 02:33:18 +02:00
- Loch nicht unendlich dünn $->$ Unschärfescheibchen
2024-08-05 16:59:57 +02:00
- Beugung an Blende
]
)
#grid(
columns: 2,
[
Abbildungsformel $1 / f = 1 / g + 1 / b$
Vergrößerung
2024-08-15 02:33:18 +02:00
$V = "Bildgröße" / "Objektivgröße" = - b / z_c = - b / g = - f / (g - f) = - 1 / (q / f - 1)$
2024-08-05 16:59:57 +02:00
],
image("res/lense-001.png")
)
2024-08-06 00:41:03 +02:00
#image("res/perspective-001.png")
#grid(
columns: 3 * (1fr,),
align: center,
[entozentrische Perspektive],
[telezentrische Perspektive],
[hyperzentrische Perspektive]
)
2024-08-05 16:59:57 +02:00
*Chromatische Aberration*: unterschiedliche Wellenlängen werden unterschiedlich
gebrochen.
2024-08-15 02:33:18 +02:00
- Linsensystem aus zwei/drei Linsen $->$ Brennpunkte der Wellenlängen stimmen überein
- Spiegeloptiken: Reflexionsgesetz gilt unabhängig der Wellenlänge
2024-08-05 16:59:57 +02:00
- Monochromatisches Licht
Vor/Nachteil telezentrisches Objektiv
2024-08-06 00:41:03 +02:00
#pagebreak()
2024-08-05 16:59:57 +02:00
*Photometrie* objektive Größen, Physikalisch
*Radiometrie* subjektive Größen; sichtbares Licht
Rezeptoren Auge
- L-Zapfen (Rot-Rezeptoren)
- M-Zapfen (Grün-Rezeptoren)
- S-Zapfen (Blau-Rezeptoren)
- Stäbchen (Licht)
Warum keine Rot-Grün Valenz
2024-08-15 02:33:18 +02:00
Sinnesreize der Zapfen werden zu kombinierten Nervensignalen kombiniert
2024-08-05 16:59:57 +02:00
(Rot-Grün, Blau-Gelb verschmieren)
- R-G Chromanz
- Luminanz
- B-Y Chromanz
2024-08-06 00:41:03 +02:00
*Farbvalenz*: Beschreibung des Farbeindrucks mit 3 Dimensionen
2024-08-15 02:33:18 +02:00
*Metamer*: verschiedene Farbreize (Spektren) mit identischer Farbvalenz (Orange = Rot + Gelb)
2024-08-06 00:41:03 +02:00
#grid(
columns: 2,
[
*Weißpunkt*: $x = y = 1 / 3$
*Spektralfarbenkurve*: Rad
*Purpurlinie*: untere Linie
*additive Mischung*: alle Farben in der konvexen Hülle der zu mischenden Punkte
],
image(height: 200pt, "res/color-001.jpg")
)
2024-08-05 16:59:57 +02:00
*CMOS vs CCD*
2 Vorteile + 2 Nachteile
#table(
columns: (1fr, 1fr),
table.header([*CMOS*], [*CCD*]),
[
Vorteile
#set list(marker: [+])
2024-08-15 02:33:18 +02:00
- frei Adressierbar (schnelle Teilbilder)
2024-08-05 16:59:57 +02:00
- hoher Dynamikbereich
- geringer Energiebedarf
- geringe Herstellungskosten
- hohe Dichte (geringe Baugröße)
],
[
Vorteile
#set list(marker: [+])
- lineare Charakteristik
- Sättigung
],
[
Nachteile
#set list(marker: [-])
- Empfindlichkeitsunterschiede in Pixeln (kalibrierbar)
- Verstärkungsunterschiede in Pixeln (kalibrierbar)
- hoher Dunkelstrom
],
[
Nachteile
#set list(marker: [-])
- *Blooming*: Überlaufen der Ladung in (vertikalen) Nachbarzellen
- *Smear*: Belichtung während des Verschieben der Ladung
]
)
Dunkelstrom: falsches Bildsignal durch thermisches Rauschen; durch kühlen beheben
2024-08-06 00:41:03 +02:00
#pagebreak()
2024-08-05 16:59:57 +02:00
*Histogramm-Spreizung*
2024-08-06 00:41:03 +02:00
#align(center, image(
height: 80pt,
"res/histogramm-001.jpg"
))
2024-08-05 16:59:57 +02:00
Histogramm ausreichen, zeichnen
$
hat(P)_i = 1 / "MN" sum^(M-1)^(m=0) sum^(N-1)_(n=0) delta^(q_i)_(g_"mn"),
i=0,...,K-1
"Kronecker-Delta: " delta^b_a := cases(1 "für" a = b, 0 "für" a != b)
$
2024-08-06 00:41:03 +02:00
Histogramm-Spreizung Formen
$gamma(g) = (g - g_min) (q_(k-1) - q_0) / (g_max - g_min) + q_0$,
2024-08-05 16:59:57 +02:00
$gamma(g_min) = q_0, gamma(g_max) = q_(K-1)$
*Radon-Transformation* (finde geradenhafte Strukturen; Winkel $phi$ = x, Distanz u = y)
#pad(bottom: 15pt, align(center,grid(
columns: 2,
2024-08-06 00:41:03 +02:00
rows: 100pt,
2024-08-05 16:59:57 +02:00
column-gutter: 40pt,
figure(image("res/hough-001.jpg"), caption: [Originalbild]),
figure(image("res/hough-002.jpg"), caption: [Hough-Transformation])
)))
$
g(u, phi) = R{g(x)} := integral.double^inf_inf g(x) delta(x^T e_phi - u) dif x
" ,mit" phi in [0, pi), u in R, e_phi = vec(cos phi, sin phi)
$
Integrationsgerade $phi$-Gerade:
$delta(x^T e_phi - u) = cases(inf "für" x^T e_phi - u = 0, 0 "für" x^T e_phi - u != 0)$
2024-08-15 02:33:18 +02:00
sorgt dafür, dass Bildwerte längs Geraden mit Parametern u (Ursprungsabstand)
und $phi$ (Winkel) aufintegriert werden.
2024-08-05 16:59:57 +02:00
Enthält $g(x)$ eine $delta$-Gerade $delta(v^T u_phi_0 - u_0)$, so zeigt $g(u,
2024-08-15 02:33:18 +02:00
phi)$ ein ausgeprägtes Maximum bei $phi = phi_0, u = u_0$
2024-08-05 16:59:57 +02:00
*Hough-Transformation* Radon-Transformation für Binärbilder
Für jeden gesetzten Bildpunkt $g(x) = 1$ wird die Geradengleichung $x^T e_phi - u = 0$
ausgewertet: \ $u = x^T e_phi = x cos phi + y sin phi$
#set box(inset: 4pt)
#grid(
columns: 3 * (1fr,),
grid(
columns: 5,
box[ ], box[2], rect[1], rect[0], rect[0],
box[y], box[1], rect[0], rect[1], rect[0],
box[ ], box[0], rect[0], rect[0], rect[1],
box[ ], box[ ], box[0], box[1], box[2],
box[ ], box[ ], box[ ], box[x], box[ ],
),
table(
columns: 5,
table.header([$x$ \\ $phi$], $0$, $pi / 6$, $pi / 3$, $pi / 2$),
$(2,0)^T$, $2$, $2$, $1$, $0$,
$(1,1)^T$, $1$, $1$, $1$, $1$,
$(0,2)^T$, $0$, $1$, $2$, $2$
),
grid(
columns: 6,
box[ ], box[3], rect[0], rect[0], rect[0], rect[0],
box[ ], box[2], rect[1], rect[1], rect[1], rect[1],
box[y], box[1], rect[1], rect[2], rect[2], rect[1],
box[ ], box[0], rect[0], rect[0], rect[0], rect[1],
box[ ], box[ ], box[0], box[$pi/6$], box[$pi/3$], box[$pi/2$],
box[ ], box[ ], box[ ], box[x], box[ ], box[ ]
),
)
2024-08-06 00:41:03 +02:00
#v(-1cm)
2024-08-15 02:33:18 +02:00
*Karhunen-Loève-Transformation* \
2024-08-05 16:59:57 +02:00
(reduziere Korrelation zwischen Kanälen zu einem mit viel Information)
- Schätzung der Kovarianzmatrix $C_"gg"$ der Farbwerte
- Lösung des Eigenwertproblems
- zeilenweise Anordnung der Eigenvektoren in absteigender Reihenfolge der
Eigenwerte $A$
- Subtraktion des mittleren Farbwertes und Transformation $k = A(g - mu_g)$
2024-08-06 00:41:03 +02:00
// #image(height: 5cm, "res/morphologie-001.png")
// Rand-Extraktion: $G without (G minus.circle S)$
2024-08-05 16:59:57 +02:00
#page(
header: none,
margin: (y: 15pt)
)[
= Bilder zuordnen #h(1fr) (20 P)
#grid(
columns: (1fr, 1fr),
column-gutter: 40pt,
table(
image("res/images-001.png"),
[Schwellenwert (Binarisierung)],
[$ cases(1 "für" g(x) > gamma, 0 "sonst") $]
),
table(
image("res/images-002.png"),
[Invertierung],
[$ max(g(x)) - g(x)$]
),
table(
image("res/images-003.png"),
[Betragsspektrum],
[$abs(integral.double g(x) e^(-j 2 x f^T x) dif x )$]
),
table(
image("res/images-004.png"),
[Verrauschung (additiv, normalverteilt)],
[$ g(x) + e(x), e(x) ~ N(0, sigma^2)$]
),
table(
image("res/images-005.png"),
[Radon-Transformation],
[$integral.double g(x) delta(x^T e_phi - u) dif x$]
),
table(
image("res/images-006.png"),
[Verschärfung],
[$4 dot g(x) - 3 dot "TP"{g(x)}$]
),
table(
image("res/images-007.png"),
[Laplacian-of-Gaussian],
[$-Delta("TP"{g(x)})$]
),
table(
image("res/images-008.png"),
[homomorphe Filterung],
[$exp("HP"{ln(g(x))})$]
),
table(
image("res/images-009.png"),
[Gradientenbetrag],
[$sqrt(((partial g(x))/(partial x))^2 + ((partial g(x))/(partial y))^2)$]
),
table(
image("res/images-010.png"),
[Fensterung (mit Hann-Fenster)],
[$g(x) dot w_"Hann"(x)$]
),
)
]
= Filterung #h(1fr) (10 P)
= Lichtschnittverfahren / Triangulation #h(1fr) (30 P)
2024-08-15 02:33:18 +02:00
Wie muss Oberfläche beschaffen sein, damit Triangulation berechnet werden kann?
2024-08-05 16:59:57 +02:00
#grid(
columns: 2,
[
2024-08-06 00:41:03 +02:00
*Spiegelnde Oberfläche*: Kein Licht gelangt auf den Sensor
2024-08-05 16:59:57 +02:00
2024-08-06 00:41:03 +02:00
*Teiltransparentes Objekt* (Volumenstreuung)
- Aufweitung des Lichtpunkts
- Messunsicherheit steigt
2024-08-05 16:59:57 +02:00
2024-08-06 00:41:03 +02:00
*Abschattung des Beobachtungsstrahls*: Kein Licht gelangt auf den Sensor
2024-08-05 16:59:57 +02:00
2024-08-06 00:41:03 +02:00
*Mehrfachreflexion bei teilspiegelndem Objekt*: Zusätzliche, falsche Messpunkte
2024-08-05 16:59:57 +02:00
],
image(height: 7cm, "res/triangulation-001.jpg")
)
#grid(
columns: 2,
column-gutter: 1cm,
pad(top: .5cm)[
*Hellfeld*: Gerichtetes Licht, das (bei fehlerfreiem Objekt) direkt in die Kamera gelenkt wird
*Dunkelfeld*: Gerichtetes Licht, das (bei fehlerfreiem Objekt) an der Kamera vorbei gelenkt wird
*Rotkanal*: koaxiale Hellfeldbeleuchtung, liefert Transmission
*Grünkanal*: streifende Beleuchtung in Dunkelfeldanordnung
macht streuende Partikel auf der Oberfläche sichtbar
*Blaukanal*: Dunkelfeld, macht Kratzer, Fusseln und Blasensichtbar
],
image(
height: 6cm,
"res/dunkelfeld-001.jpg"
)
)
2024-08-06 00:41:03 +02:00
#grid(
columns: 2,
[
$
B_1 / b = (a / 2 - G) / g, - B_2 / b = (a / 2 + G) / g
$
Daraus erhält man die Disparität (Parallaxe):
$
p := B_1 - B_2 = (a b) / g
$
],
image("res/stereo-001.png")
)
2024-08-05 16:59:57 +02:00
Zeichne Lichtschnittverfahren
Maßnahmen gegen Störlichtunterdrückung