mirror of
https://github.com/webmproject/libwebp.git
synced 2024-12-27 22:28:22 +01:00
move some SSIM-accumulation function for dsp/
This is in preparation for some SSE2 code. And generally speaking, the whole SSIM code needs some revamp: we're not averaging the SSIM value at each pixels but just computing the overall SSIM value once, for the whole plane. The former might be better than the latter. Change-Id: I935784a917f84a18ef08dc5ec9a7b528abea46a5
This commit is contained in:
parent
f08e66245a
commit
423ecaf484
@ -215,6 +215,35 @@ extern VP8GetResidualCostFunc VP8GetResidualCost;
|
|||||||
// must be called before anything using the above
|
// must be called before anything using the above
|
||||||
void VP8EncDspCostInit(void);
|
void VP8EncDspCostInit(void);
|
||||||
|
|
||||||
|
//------------------------------------------------------------------------------
|
||||||
|
// SSIM utils
|
||||||
|
|
||||||
|
// struct for accumulating statistical moments
|
||||||
|
typedef struct {
|
||||||
|
double w; // sum(w_i) : sum of weights
|
||||||
|
double xm, ym; // sum(w_i * x_i), sum(w_i * y_i)
|
||||||
|
double xxm, xym, yym; // sum(w_i * x_i * x_i), etc.
|
||||||
|
} VP8DistoStats;
|
||||||
|
|
||||||
|
#define VP8_SSIM_KERNEL 3 // total size of the kernel: 2 * VP8_SSIM_KERNEL + 1
|
||||||
|
typedef void (*VP8SSIMAccumulateClippedFunc)(const uint8_t* src1, int stride1,
|
||||||
|
const uint8_t* src2, int stride2,
|
||||||
|
int xo, int yo, // center position
|
||||||
|
int W, int H, // plane dimension
|
||||||
|
VP8DistoStats* const stats);
|
||||||
|
|
||||||
|
// This version is called with the guarantee that you can load 8 bytes and
|
||||||
|
// 8 rows at offset src1 and src2
|
||||||
|
typedef void (*VP8SSIMAccumulateFunc)(const uint8_t* src1, int stride1,
|
||||||
|
const uint8_t* src2, int stride2,
|
||||||
|
VP8DistoStats* const stats);
|
||||||
|
|
||||||
|
VP8SSIMAccumulateFunc VP8SSIMAccumulate; // unclipped / unchecked
|
||||||
|
VP8SSIMAccumulateClippedFunc VP8SSIMAccumulateClipped; // with clipping
|
||||||
|
|
||||||
|
// must be called before using any of the above directly
|
||||||
|
void VP8SSIMDspInit(void);
|
||||||
|
|
||||||
//------------------------------------------------------------------------------
|
//------------------------------------------------------------------------------
|
||||||
// Decoding
|
// Decoding
|
||||||
|
|
||||||
|
@ -702,6 +702,68 @@ static void Copy16x8(const uint8_t* src, uint8_t* dst) {
|
|||||||
Copy(src, dst, 16, 8);
|
Copy(src, dst, 16, 8);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
//------------------------------------------------------------------------------
|
||||||
|
|
||||||
|
static void SSIMAccumulateClipped(const uint8_t* src1, int stride1,
|
||||||
|
const uint8_t* src2, int stride2,
|
||||||
|
int xo, int yo, int W, int H,
|
||||||
|
VP8DistoStats* const stats) {
|
||||||
|
const int ymin = (yo - VP8_SSIM_KERNEL < 0) ? 0 : yo - VP8_SSIM_KERNEL;
|
||||||
|
const int ymax = (yo + VP8_SSIM_KERNEL > H - 1) ? H - 1
|
||||||
|
: yo + VP8_SSIM_KERNEL;
|
||||||
|
const int xmin = (xo - VP8_SSIM_KERNEL < 0) ? 0 : xo - VP8_SSIM_KERNEL;
|
||||||
|
const int xmax = (xo + VP8_SSIM_KERNEL > W - 1) ? W - 1
|
||||||
|
: xo + VP8_SSIM_KERNEL;
|
||||||
|
int x, y;
|
||||||
|
src1 += ymin * stride1;
|
||||||
|
src2 += ymin * stride2;
|
||||||
|
for (y = ymin; y <= ymax; ++y, src1 += stride1, src2 += stride2) {
|
||||||
|
for (x = xmin; x <= xmax; ++x) {
|
||||||
|
const int s1 = src1[x];
|
||||||
|
const int s2 = src2[x];
|
||||||
|
stats->w += 1;
|
||||||
|
stats->xm += s1;
|
||||||
|
stats->ym += s2;
|
||||||
|
stats->xxm += s1 * s1;
|
||||||
|
stats->xym += s1 * s2;
|
||||||
|
stats->yym += s2 * s2;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
static void SSIMAccumulate(const uint8_t* src1, int stride1,
|
||||||
|
const uint8_t* src2, int stride2,
|
||||||
|
VP8DistoStats* const stats) {
|
||||||
|
int x, y;
|
||||||
|
for (y = 0; y <= 2 * VP8_SSIM_KERNEL; ++y, src1 += stride1, src2 += stride2) {
|
||||||
|
for (x = 0; x <= 2 * VP8_SSIM_KERNEL; ++x) {
|
||||||
|
const int s1 = src1[x];
|
||||||
|
const int s2 = src2[x];
|
||||||
|
stats->w += 1;
|
||||||
|
stats->xm += s1;
|
||||||
|
stats->ym += s2;
|
||||||
|
stats->xxm += s1 * s1;
|
||||||
|
stats->xym += s1 * s2;
|
||||||
|
stats->yym += s2 * s2;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
VP8SSIMAccumulateFunc VP8SSIMAccumulate;
|
||||||
|
VP8SSIMAccumulateClippedFunc VP8SSIMAccumulateClipped;
|
||||||
|
|
||||||
|
static volatile VP8CPUInfo ssim_last_cpuinfo_used =
|
||||||
|
(VP8CPUInfo)&ssim_last_cpuinfo_used;
|
||||||
|
|
||||||
|
WEBP_TSAN_IGNORE_FUNCTION void VP8SSIMDspInit(void) {
|
||||||
|
if (ssim_last_cpuinfo_used == VP8GetCPUInfo) return;
|
||||||
|
|
||||||
|
VP8SSIMAccumulate = SSIMAccumulate;
|
||||||
|
VP8SSIMAccumulateClipped = SSIMAccumulateClipped;
|
||||||
|
|
||||||
|
ssim_last_cpuinfo_used = VP8GetCPUInfo;
|
||||||
|
}
|
||||||
|
|
||||||
//------------------------------------------------------------------------------
|
//------------------------------------------------------------------------------
|
||||||
// Initialization
|
// Initialization
|
||||||
|
|
||||||
|
@ -107,10 +107,9 @@ static void DoFilter(const VP8EncIterator* const it, int level) {
|
|||||||
//------------------------------------------------------------------------------
|
//------------------------------------------------------------------------------
|
||||||
// SSIM metric
|
// SSIM metric
|
||||||
|
|
||||||
enum { KERNEL = 3 };
|
|
||||||
static const double kMinValue = 1.e-10; // minimal threshold
|
static const double kMinValue = 1.e-10; // minimal threshold
|
||||||
|
|
||||||
void VP8SSIMAddStats(const DistoStats* const src, DistoStats* const dst) {
|
void VP8SSIMAddStats(const VP8DistoStats* const src, VP8DistoStats* const dst) {
|
||||||
dst->w += src->w;
|
dst->w += src->w;
|
||||||
dst->xm += src->xm;
|
dst->xm += src->xm;
|
||||||
dst->ym += src->ym;
|
dst->ym += src->ym;
|
||||||
@ -119,32 +118,7 @@ void VP8SSIMAddStats(const DistoStats* const src, DistoStats* const dst) {
|
|||||||
dst->yym += src->yym;
|
dst->yym += src->yym;
|
||||||
}
|
}
|
||||||
|
|
||||||
static void VP8SSIMAccumulate(const uint8_t* src1, int stride1,
|
double VP8SSIMGet(const VP8DistoStats* const stats) {
|
||||||
const uint8_t* src2, int stride2,
|
|
||||||
int xo, int yo, int W, int H,
|
|
||||||
DistoStats* const stats) {
|
|
||||||
const int ymin = (yo - KERNEL < 0) ? 0 : yo - KERNEL;
|
|
||||||
const int ymax = (yo + KERNEL > H - 1) ? H - 1 : yo + KERNEL;
|
|
||||||
const int xmin = (xo - KERNEL < 0) ? 0 : xo - KERNEL;
|
|
||||||
const int xmax = (xo + KERNEL > W - 1) ? W - 1 : xo + KERNEL;
|
|
||||||
int x, y;
|
|
||||||
src1 += ymin * stride1;
|
|
||||||
src2 += ymin * stride2;
|
|
||||||
for (y = ymin; y <= ymax; ++y, src1 += stride1, src2 += stride2) {
|
|
||||||
for (x = xmin; x <= xmax; ++x) {
|
|
||||||
const int s1 = src1[x];
|
|
||||||
const int s2 = src2[x];
|
|
||||||
stats->w += 1;
|
|
||||||
stats->xm += s1;
|
|
||||||
stats->ym += s2;
|
|
||||||
stats->xxm += s1 * s1;
|
|
||||||
stats->xym += s1 * s2;
|
|
||||||
stats->yym += s2 * s2;
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
double VP8SSIMGet(const DistoStats* const stats) {
|
|
||||||
const double xmxm = stats->xm * stats->xm;
|
const double xmxm = stats->xm * stats->xm;
|
||||||
const double ymym = stats->ym * stats->ym;
|
const double ymym = stats->ym * stats->ym;
|
||||||
const double xmym = stats->xm * stats->ym;
|
const double xmym = stats->xm * stats->ym;
|
||||||
@ -165,7 +139,7 @@ double VP8SSIMGet(const DistoStats* const stats) {
|
|||||||
return (fden != 0.) ? fnum / fden : kMinValue;
|
return (fden != 0.) ? fnum / fden : kMinValue;
|
||||||
}
|
}
|
||||||
|
|
||||||
double VP8SSIMGetSquaredError(const DistoStats* const s) {
|
double VP8SSIMGetSquaredError(const VP8DistoStats* const s) {
|
||||||
if (s->w > 0.) {
|
if (s->w > 0.) {
|
||||||
const double iw2 = 1. / (s->w * s->w);
|
const double iw2 = 1. / (s->w * s->w);
|
||||||
const double sxx = s->xxm * s->w - s->xm * s->xm;
|
const double sxx = s->xxm * s->w - s->xm * s->xm;
|
||||||
@ -177,33 +151,65 @@ double VP8SSIMGetSquaredError(const DistoStats* const s) {
|
|||||||
return kMinValue;
|
return kMinValue;
|
||||||
}
|
}
|
||||||
|
|
||||||
void VP8SSIMAccumulatePlane(const uint8_t* src1, int stride1,
|
#define LIMIT(A, M) ((A) > (M) ? (M) : (A))
|
||||||
const uint8_t* src2, int stride2,
|
static void VP8SSIMAccumulateRow(const uint8_t* src1, int stride1,
|
||||||
int W, int H, DistoStats* const stats) {
|
const uint8_t* src2, int stride2,
|
||||||
int x, y;
|
int y, int W, int H,
|
||||||
for (y = 0; y < H; ++y) {
|
VP8DistoStats* const stats) {
|
||||||
for (x = 0; x < W; ++x) {
|
int x = 0;
|
||||||
VP8SSIMAccumulate(src1, stride1, src2, stride2, x, y, W, H, stats);
|
const int w0 = LIMIT(VP8_SSIM_KERNEL, W);
|
||||||
}
|
for (x = 0; x < w0; ++x) {
|
||||||
|
VP8SSIMAccumulateClipped(src1, stride1, src2, stride2, x, y, W, H, stats);
|
||||||
|
}
|
||||||
|
for (; x <= W - 8 + VP8_SSIM_KERNEL; ++x) {
|
||||||
|
VP8SSIMAccumulate(
|
||||||
|
src1 + (y - VP8_SSIM_KERNEL) * stride1 + (x - VP8_SSIM_KERNEL), stride1,
|
||||||
|
src2 + (y - VP8_SSIM_KERNEL) * stride2 + (x - VP8_SSIM_KERNEL), stride2,
|
||||||
|
stats);
|
||||||
|
}
|
||||||
|
for (; x < W; ++x) {
|
||||||
|
VP8SSIMAccumulateClipped(src1, stride1, src2, stride2, x, y, W, H, stats);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void VP8SSIMAccumulatePlane(const uint8_t* src1, int stride1,
|
||||||
|
const uint8_t* src2, int stride2,
|
||||||
|
int W, int H, VP8DistoStats* const stats) {
|
||||||
|
int x, y;
|
||||||
|
const int h0 = LIMIT(VP8_SSIM_KERNEL, H);
|
||||||
|
const int h1 = LIMIT(VP8_SSIM_KERNEL, H - VP8_SSIM_KERNEL);
|
||||||
|
for (y = 0; y < h0; ++y) {
|
||||||
|
for (x = 0; x < W; ++x) {
|
||||||
|
VP8SSIMAccumulateClipped(src1, stride1, src2, stride2, x, y, W, H, stats);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
for (; y < h1; ++y) {
|
||||||
|
VP8SSIMAccumulateRow(src1, stride1, src2, stride2, y, W, H, stats);
|
||||||
|
}
|
||||||
|
for (; y < H; ++y) {
|
||||||
|
for (x = 0; x < W; ++x) {
|
||||||
|
VP8SSIMAccumulateClipped(src1, stride1, src2, stride2, x, y, W, H, stats);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
#undef LIMIT
|
||||||
|
|
||||||
static double GetMBSSIM(const uint8_t* yuv1, const uint8_t* yuv2) {
|
static double GetMBSSIM(const uint8_t* yuv1, const uint8_t* yuv2) {
|
||||||
int x, y;
|
int x, y;
|
||||||
DistoStats s = { .0, .0, .0, .0, .0, .0 };
|
VP8DistoStats s = { .0, .0, .0, .0, .0, .0 };
|
||||||
|
|
||||||
// compute SSIM in a 10 x 10 window
|
// compute SSIM in a 10 x 10 window
|
||||||
for (x = 3; x < 13; x++) {
|
for (y = VP8_SSIM_KERNEL; y < 16 - VP8_SSIM_KERNEL; y++) {
|
||||||
for (y = 3; y < 13; y++) {
|
for (x = VP8_SSIM_KERNEL; x < 16 - VP8_SSIM_KERNEL; x++) {
|
||||||
VP8SSIMAccumulate(yuv1 + Y_OFF_ENC, BPS, yuv2 + Y_OFF_ENC, BPS,
|
VP8SSIMAccumulateClipped(yuv1 + Y_OFF_ENC, BPS, yuv2 + Y_OFF_ENC, BPS,
|
||||||
x, y, 16, 16, &s);
|
x, y, 16, 16, &s);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
for (x = 1; x < 7; x++) {
|
for (x = 1; x < 7; x++) {
|
||||||
for (y = 1; y < 7; y++) {
|
for (y = 1; y < 7; y++) {
|
||||||
VP8SSIMAccumulate(yuv1 + U_OFF_ENC, BPS, yuv2 + U_OFF_ENC, BPS,
|
VP8SSIMAccumulateClipped(yuv1 + U_OFF_ENC, BPS, yuv2 + U_OFF_ENC, BPS,
|
||||||
x, y, 8, 8, &s);
|
x, y, 8, 8, &s);
|
||||||
VP8SSIMAccumulate(yuv1 + V_OFF_ENC, BPS, yuv2 + V_OFF_ENC, BPS,
|
VP8SSIMAccumulateClipped(yuv1 + V_OFF_ENC, BPS, yuv2 + V_OFF_ENC, BPS,
|
||||||
x, y, 8, 8, &s);
|
x, y, 8, 8, &s);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
@ -222,6 +228,7 @@ void VP8InitFilter(VP8EncIterator* const it) {
|
|||||||
(*it->lf_stats_)[s][i] = 0;
|
(*it->lf_stats_)[s][i] = 0;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
VP8SSIMDspInit();
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -27,7 +27,7 @@
|
|||||||
|
|
||||||
static void AccumulateLSIM(const uint8_t* src, int src_stride,
|
static void AccumulateLSIM(const uint8_t* src, int src_stride,
|
||||||
const uint8_t* ref, int ref_stride,
|
const uint8_t* ref, int ref_stride,
|
||||||
int w, int h, DistoStats* stats) {
|
int w, int h, VP8DistoStats* stats) {
|
||||||
int x, y;
|
int x, y;
|
||||||
double total_sse = 0.;
|
double total_sse = 0.;
|
||||||
for (y = 0; y < h; ++y) {
|
for (y = 0; y < h; ++y) {
|
||||||
@ -71,11 +71,13 @@ static float GetPSNR(const double v) {
|
|||||||
|
|
||||||
int WebPPictureDistortion(const WebPPicture* src, const WebPPicture* ref,
|
int WebPPictureDistortion(const WebPPicture* src, const WebPPicture* ref,
|
||||||
int type, float result[5]) {
|
int type, float result[5]) {
|
||||||
DistoStats stats[5];
|
VP8DistoStats stats[5];
|
||||||
int w, h;
|
int w, h;
|
||||||
|
|
||||||
memset(stats, 0, sizeof(stats));
|
memset(stats, 0, sizeof(stats));
|
||||||
|
|
||||||
|
VP8SSIMDspInit();
|
||||||
|
|
||||||
if (src == NULL || ref == NULL ||
|
if (src == NULL || ref == NULL ||
|
||||||
src->width != ref->width || src->height != ref->height ||
|
src->width != ref->width || src->height != ref->height ||
|
||||||
src->use_argb != ref->use_argb || result == NULL) {
|
src->use_argb != ref->use_argb || result == NULL) {
|
||||||
|
@ -473,17 +473,12 @@ int VP8EncFinishAlpha(VP8Encoder* const enc); // finalize compressed data
|
|||||||
int VP8EncDeleteAlpha(VP8Encoder* const enc); // delete compressed data
|
int VP8EncDeleteAlpha(VP8Encoder* const enc); // delete compressed data
|
||||||
|
|
||||||
// in filter.c
|
// in filter.c
|
||||||
|
void VP8SSIMAddStats(const VP8DistoStats* const src, VP8DistoStats* const dst);
|
||||||
// SSIM utils
|
|
||||||
typedef struct {
|
|
||||||
double w, xm, ym, xxm, xym, yym;
|
|
||||||
} DistoStats;
|
|
||||||
void VP8SSIMAddStats(const DistoStats* const src, DistoStats* const dst);
|
|
||||||
void VP8SSIMAccumulatePlane(const uint8_t* src1, int stride1,
|
void VP8SSIMAccumulatePlane(const uint8_t* src1, int stride1,
|
||||||
const uint8_t* src2, int stride2,
|
const uint8_t* src2, int stride2,
|
||||||
int W, int H, DistoStats* const stats);
|
int W, int H, VP8DistoStats* const stats);
|
||||||
double VP8SSIMGet(const DistoStats* const stats);
|
double VP8SSIMGet(const VP8DistoStats* const stats);
|
||||||
double VP8SSIMGetSquaredError(const DistoStats* const stats);
|
double VP8SSIMGetSquaredError(const VP8DistoStats* const stats);
|
||||||
|
|
||||||
// autofilter
|
// autofilter
|
||||||
void VP8InitFilter(VP8EncIterator* const it);
|
void VP8InitFilter(VP8EncIterator* const it);
|
||||||
|
Loading…
Reference in New Issue
Block a user