pytorchの公式のドキュメンテーション(出典https://pytorch.org/vision/main/generated/torchvision.transforms.functional.perspective.html)によると、8個のポイントの座標が必要であることがわかりました。startpointsとendpointsという座標のパラメータが必要です。それらはそれぞれ変換のソースとターゲットを表記しています。
startpoints及びendpointsは、各自4個のlistを含んで、各listは2整数で表す座標を含んでいます。その2の整数は、一つ目は横座標で、二つ目は縦座標です。pytorchのtensorの次元は、通常にbatch size、channel、高さ、幅の番でそれぞれ表示しますので、そこでは注意してください。
自分の実験において、その座標は、1からではなく、0からですが、その4個のlistは、1番目の元を除き、ほかの3つの元が記録している座標は、実際にその座標の1ピクセル左と1ピクセル上のそのピクセル対応しています。つまり、そのlistを区間として考えると、なんか左閉半開区間の感じです。
More than 1 year has passed since last update.
Register as a new user and use Qiita more conveniently
- You get articles that match your needs
- You can efficiently read back useful information
- You can use dark theme