Я пытаюсь преобразовать кадр RGB, взятый из OpenGL glReadPixels (), в кадр YUV и записать кадр YUV в файл (.yuv). Позже я хотел бы записать его в named_pipe как вход для FFMPEG, но пока я просто хочу записать его в файл и просмотреть результат изображения с помощью средства просмотра изображений YUV. Так что пока просто не обращайте внимания на «писать в трубу».
После запуска моего кода я обнаружил следующие ошибки:
Количество кадров, отображаемое в программе просмотра изображений YUV Image Viewer, всегда составляет 1/3 от количества кадров, заявленных в моей программе. Когда я объявляю fps равным 10, я мог просматривать только 3 кадра. Когда я объявил 30 кадров в секунду, я мог просматривать только 10 кадров. Однако, когда я просматривал файл в текстовом редакторе, я мог видеть, что в файле напечатано правильное количество слова «FRAME». Это пример вывода, который я получил: http://www.bobdanani.net/image.yuv
Я не смог увидеть правильное изображение, а только несколько искаженных зеленых, синих, желтых и черных пикселей.
Я прочитал о формате YUV из http://wiki.multimedia.cx/index.php?title=YUV4MPEG2 и http://www.fourcc.org/fccyvrgb.php#mikes_answer и http://kylecordes.com/2007/pipe-ffmpeg
Вот что я пробовал до сих пор. Я знаю, что такой подход к преобразованию неэффективен, и я могу оптимизировать его позже. Теперь я просто хочу, чтобы этот наивный подход работал и изображение отображалось правильно.
int frameCounter = 1;
int windowWidth = 0, windowHeight = 0;
unsigned char *yuvBuffer;
unsigned long bufferLength = 0;
unsigned long frameLength = 0;
int fps = 10;
void display(void) {
/* clear the color buffers */
glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);
/* DRAW some OPENGL animation, i.e. cube, sphere, etc
.......
.......
*/
glutSwapBuffers();
if ((frameCounter % fps) == 1){
bufferLength = 0;
windowWidth = glutGet(GLUT_WINDOW_WIDTH);
windowHeight = glutGet (GLUT_WINDOW_HEIGHT);
frameLength = (long) (windowWidth * windowHeight * 1.5 * fps) + 100; // YUV 420 length (width*height*1.5) + header length
yuvBuffer = new unsigned char[frameLength];
write_yuv_frame_header();
}
write_yuv_frame();
frameCounter = (frameCounter % fps) + 1;
if ( (frameCounter % fps) == 1){
snprintf(filename, 100, "out/image-%d.yuv", seq_num);
ofstream out(filename, ios::out | ios::binary);
if(!out) {
cout << "Cannot open file.\n";
}
out.write (reinterpret_cast<char*> (yuvBuffer), bufferLength);
out.close();
bufferLength = 0;
delete[] yuvBuffer;
}
}
void write_yuv_frame_header (){
char *yuvHeader = new char[100];
sprintf (yuvHeader, "YUV4MPEG2 W%d H%d F%d:1 Ip A0:0 C420mpeg2 XYSCSS=420MPEG2\n", windowWidth, windowHeight, fps);
memcpy ((char*)yuvBuffer + bufferLength, yuvHeader, strlen(yuvHeader));
bufferLength += strlen (yuvHeader);
delete (yuvHeader);
}
void write_yuv_frame() {
int width = glutGet(GLUT_WINDOW_WIDTH);
int height = glutGet(GLUT_WINDOW_HEIGHT);
memcpy ((void*) (yuvBuffer+bufferLength), (void*) "FRAME\n", 6);
bufferLength +=6;
long length = windowWidth * windowHeight;
long yuv420FrameLength = (float)length * 1.5;
long lengthRGB = length * 3;
unsigned char *rgb = (unsigned char *) malloc(lengthRGB * sizeof(unsigned char));
unsigned char *yuvdest = (unsigned char *) malloc(yuv420FrameLength * sizeof(unsigned char));
glReadPixels(0, 0, windowWidth, windowHeight, GL_RGB, GL_UNSIGNED_BYTE, rgb);
int r, g, b, y, u, v, ypos, upos, vpos;
for (int j = 0; j < windowHeight; ++j){
for (int i = 0; i < windowWidth; ++i){
r = (int)rgb[(j * windowWidth + i) * 3 + 0];
g = (int)rgb[(j * windowWidth + i) * 3 + 1];
b = (int)rgb[(j * windowWidth + i) * 3 + 2];
y = (int)(r * 0.257 + g * 0.504 + b * 0.098) + 16;
u = (int)(r * 0.439 + g * -0.368 + b * -0.071) + 128;
v = (int)(r * -0.148 + g * -0.291 + b * 0.439 + 128);
ypos = j * windowWidth + i;
upos = (j/2) * (windowWidth/2) + i/2 + length;
vpos = (j/2) * (windowWidth/2) + i/2 + length + length/4;
yuvdest[ypos] = y;
yuvdest[upos] = u;
yuvdest[vpos] = v;
}
}
memcpy ((void*) (yuvBuffer + bufferLength), (void*)yuvdest, yuv420FrameLength);
bufferLength += yuv420FrameLength;
free (yuvdest);
free (rgb);
}
Это только самый простой подход, и я смогу оптимизировать алгоритм преобразования позже. Может ли кто-нибудь сказать мне, что не так в моем подходе? Я предполагаю, что одна из проблем связана с вызовом outstream.write (), потому что я преобразовал данные unsigned char * в данные char *, что может привести к потере точности данных. Но если я не приведу его к char *, я получу ошибку компиляции. Однако это не объясняет, почему выходные кадры повреждены (составляет только 1/3 от общего числа кадров).