RU2534005C2 - Способ и система преобразования моментального снимка экрана в метафайл - Google Patents

Способ и система преобразования моментального снимка экрана в метафайл Download PDF

Info

Publication number
RU2534005C2
RU2534005C2 RU2013104245/08A RU2013104245A RU2534005C2 RU 2534005 C2 RU2534005 C2 RU 2534005C2 RU 2013104245/08 A RU2013104245/08 A RU 2013104245/08A RU 2013104245 A RU2013104245 A RU 2013104245A RU 2534005 C2 RU2534005 C2 RU 2534005C2
Authority
RU
Russia
Prior art keywords
text
screenshot
fragments
module
smoothed
Prior art date
Application number
RU2013104245/08A
Other languages
English (en)
Other versions
RU2013104245A (ru
Inventor
Сергей Михайлович Михеев
Илья Васильевич Курилин
Илья Владимирович Сафонов
Алексей Михайлович Вилькин
Original Assignee
Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." filed Critical Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority to RU2013104245/08A priority Critical patent/RU2534005C2/ru
Priority to KR1020140003340A priority patent/KR101887929B1/ko
Publication of RU2013104245A publication Critical patent/RU2013104245A/ru
Application granted granted Critical
Publication of RU2534005C2 publication Critical patent/RU2534005C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

Изобретение относится к средствам преобразования растрового изображения в метафайл. Техническим результатом является повышение четкости текстовых символов на скриншоте. В способе обнаруживают фрагменты сглаженного текста на снимке экрана, оценивают цвет фона и цвет символов сглаженного текста на каждом фрагменте на основе определения крайних столбцов гистограммы фрагмента, векторизуют контуры символов сглаженного текста, модифицируют снимок экрана за счет замещения фрагментов сглаженного текста цветом фона, создают метафайл на основе модифицированного снимка экрана и векторизованных контуров, заполненных цветом символов сглаженного текста, визуализируют созданный метафайл. 2 н. и 7 з.п. ф-лы, 9 ил.

Description

Изобретение относится к области обработки цифровых сигналов, а именно к способам преобразования растрового изображения в метафайл, в частности к преобразованию моментального снимка экрана (скриншота) в метафайл посредством сегментации и векторизации скриншота.
Векторизация текстовой информации на растровом изображении скриншота позволяет существенно улучшить качество текста для печати и визуализации. Частичная векторизация скриншота является перспективным подходом к решению задачи и заключается в том, что обнаруженные области рисунков и области текста обрабатываются разными способами. Текстовую часть переводят в последовательность прямых и кривых отрезков с информацией о цвете символов и окружающем фоне. Оставшаяся часть информации исходного скриншота хранится как растровое изображение.
Способ, раскрытый в патенте США №8,270,722 [1], предусматривает обработку изображения с выборочной векторизацией символов и графических областей. Целью изобретения является достижение наилучшей степени компрессии при высоком качестве изображения, содержащего как области текста, так и графики. Если пиксели символа в области теста перекрываются графической областью, то сначала векторизуется графическая область, если перекрытия нет - сначала векторизуется область текста.
Способ, раскрытый в патенте США №7,873,218 [2], заключается в аппроксимации символа для преобразования бинарного изображении в контурные данные с использованием кривых Безье. Способ включает сегментацию растрового изображения для извлечения областей символов и извлечения символов из этих областей. Процесс векторизации выполняется независимо от других нетекстовых частей изображения.
Вышеупомянутые способы позволяют улучшать визуальное качество изображения посредством векторизации, но не могут быть напрямую применены для векторизации растрового изображения скриншота, который обладает рядом особенностей: а именно низким разрешением символов и применением эффекта сглаживания (антиалиасинга) текстовых символов. Данное сглаживание улучшает качество изображения на дисплее, но искажает скриншот при печати.
Способ, раскрытый в патенте США №7,079,686 [3], описывает подход, основанный на классификации пикселей на изображении документа для увеличения изображения. Для каждого пикселя изображения генерируется вектор признаков. Каждый пиксель классифицируется как текст или рисунок в зависимости от соответствующего вектора признаков. Дальнейшая обработка может включать улучшение на пиксельном уровне, которая состоит из фильтра повышения резкости границ для пикселей текста и фильтра сглаживания для пикселей рисунков.
Способ, раскрытый в патенте США №7,177,049 [4], сводится к обработке цифровых изображений, причем процесс повышения качества текста включает в себя обработку черного текста на белом фоне с увеличением резкости и контраста такого текста за счет перераспределения яркости между темными и светлыми пикселями в пределах предопределенной маски.
Описанные выше способы ориентированы на улучшение изображения, особенно областей текста исключительно перед печатью. Эти способы также не пригодны для скриншотов, поскольку разработаны для сканированных изображений.
Задача, на решение которой направлено заявляемое изобретение, заключается в том, чтобы разработать усовершенствованный способ обработки сглаженного текста (текста с антиалиасингом) на скриншоте. При этом такой способ должен обеспечить повышение резкости/четкости и контраста символов и быть применимым как для печати скриншотов, так и для сохранении скриншотов в метафайл.
Технический результат достигается за счет применения заявляемого способа, включающего в себя операции по обнаружению сглаженных символов на скриншоте и улучшению визуального представления этих символов за счет векторизации и оценки цвета заливки. При этом заявляемый способ преобразования скриншота в метафайл включает в себя выполнение следующих этапов:
- обнаруживают фрагменты текста на скриншоте;
- оценивают цвет фона и цвет символов на каждом фрагменте;
- векторизуют контуры символов;
- модифицируют скриншот за счет заполнения фрагментов текста цветом фона;
- создают метафайл на основе модифицированного скриншота и векторизованных контуров, заполненных цветом текста.
Заявляемый способ обеспечивает повышение резкости/четкости и контраста символов и может быть применен как при печати скриншотов, так и при сохранении скриншотов в метафайл, например PDF или XPS.
Далее существо заявляемого изобретения поясняется в деталях со ссылками на соответствующие графические материалы.
Фиг.1. Иллюстрация заявляемого способа в сравнении с существующими подходами.
Фиг.2. Структурная схема способа преобразования скриншота в метафайл.
Фиг.3. Блок-схема системы преобразования скриншота в метафайл.
Фиг.4. Иллюстрация способа обнаружения фрагментов со сглаженным текстом.
Фиг.5. Иллюстрация вычисления признаков сглаженного текста.
Фиг.6. Блок-схема векторизации символа.
Фиг.7. Иллюстрация векторизации символа.
Фиг.8. Создание карты сегментированного текста.
Фиг.9. Иллюстрация результата заявляемого способа.
На Фиг.1 проиллюстрировано различие между существующим подходом (прототипом), известным из уровня техники, и заявляемым способом. Скриншот 103 захватывается с экрана дисплея посредством копирования видеопамяти в промежуточный буфер. Результатом такого копирования является представление текущего кадра, визуализируемого на дисплее, в виде растрового изображения. Дисплеем может являться модуль визуализации любого цифрового вычислительного устройства, например: персонального компьютера 101, ноутбука, смартфона 102, планшетного компьютера и т.д. Особенностью скриншота является то, что представленная на нем текстовая информация обычно визуализируется с помощью технологии сглаживания (antialiasing), использующейся с целью сделать границы символов визуально более гладкими, убирая «зубцы», возникающие при растеризации на краях объектов. В этом случае пикселы, соседние с граничным пикселом изображения, принимают промежуточное значение между цветом изображения и цветом фона, визуально размывая границу. Технологии сглаживания, используемые при визуализации текста на дисплее, напрямую зависят от размера отображаемых символов и разрешения отображения, поэтому при увеличении/уменьшении масштаба перестраивают пиксельное отображение символов. Кроме того, подобные сглаживания существенно отличаются от аналогичных технологий, используемых при печати текста. Скриншот в виде растрового изображения сохраняется в каком-либо файле/формате 104, соответственно для текстовых областей становится недоступным корректное применение технологий сглаживания при отображении или печати. Это ведет к нежелательным визуальным искажениям внешнего вида текста. В соответствии с вышесказанным можно отметить следующие недостатки известного из уровня техники подхода:
- поскольку скриншот сохраняется в файл в виде растрового изображения, следовательно, будут потеряны такие преимущества обычного представления текстовой информации на дисплее, как инвариантность к масштабу и гладкое отображение очертания символов независимо от их размера. Вместо этого масштабирование растрового изображения текста будет сопровождаться такими мешающими факторами, как появление «зазубренных» краев и размытие границ;
- проявляется негативный эффект сглаживания символов, свойственный для текста, визуализируемого на дисплее. Результатом такого эффекта является искажение оригинального цвета и формы символов при печати или изменении масштаба визуализации.
Заявляемый способ 105 основан на сегментации скриншота на текстовые и нетекстовые области и векторизации текстовых областей. Подход позволяет отображать и печатать метафайл при измененном масштабе без потери качества текстовой информации.
На Фиг.2 проиллюстрированы основные шаги заявляемого способа. На шаге 201 выполняется обнаружение фрагментов текста на скриншоте и создают карту сегментированного текста. В предпочтительном варианте реализации заявленного способа данные фрагменты включают в себя последовательность символов, которые соответствуют одному или нескольким словам и части окружающего фона, а карта является растровым изображением такого же размера, как и исходный скриншот, где каждый пиксел кодируется как относящийся или не относящийся к области текста. Оценка цвета для символов и фона указанных текстовых фрагментов выполняется на шаге 202. В предпочтительном варианте осуществления заявленного способа скриншот представлен в цветовом пространстве RGB и, соответственно каждый его пиксел описывается тремя цветовыми компонентами красного, зеленого и синего цветов. Оценка каждой из трех компонент цвета (красной, зеленой, синей) происходит раздельно по гистограммам этих компонент. Крайний правый или левый столбец (группа столбцов) гистограммы с наибольшим значением (суммарным значением) соответствует цвету фона, противоположному цвету символа. На шаге 203 происходит векторизация контуров символов на карте текста путем их преобразования в последовательность отрезков прямых и кривых. Процесс проиллюстрирован на Фиг.6 и Фиг.7. На шаге 204 скриншот модифицируется посредством заполнения областей обнаруженного текста соответствующим цветом фона. Для сложного фона предпочтительно использовать более совершенный способ заполнения области текста, например технику «inpainting», т.е. закрашивания ("Bertalmio М., Sapiro G., Caselles V., Ballester С. Image inpainting // In Proc. ACM Conf. Comp. Graphics (SIGGRAPH), pages 417-424, 2000) [5]. На шаге 205 создается метафайл из соответствующих записей метафайла, сохраненных в определенной последовательности. Метафайл может быть представлен в формате: PDF, XPS, PS, EMF и др. Модифицированное изображение скриншота сохраняется в метафайл как растровое изображение. Символы сохраняются в векторном виде соответствующими графическими командами метафайла, определяющими параметры замкнутых последовательностей аппроксимирующих отрезков прямых и кривых и информацию о цвете заливки. Для оптимизации размера метафайла может быть применен алгоритм сжатия без потерь применительно к векторным записям метафайла, и алгоритм сжатия с потерями или без потерь для растровых изображений. Заявляемый подход обеспечивает эффективное хранение метафайла с точки зрения «визуальное качество/размер», так как каждый тип визуальной информации хранится оптимальным образом. Более того, заявляемый подход позволяет предотвратить искажение сглаженного текста на скриншоте при печати или визуализации при увеличенном масштабе. Это становится возможным за счет замены сглаженных символов скриншота векторными аналогами.
На Фиг.3 показана блок-схема системы преобразования скриншота в метафайл. Модуль 301 сегментации текста сегментирует текст, создает размеченную карту сегментированного текста и определяет координаты фрагментов, содержащих текст. На вход данного модуля поступает исходное растровое изображение скриншота. Карта сегментированного текста передается в модуль 304 векторизации и модуль 303 ретуширования текста, координаты фрагментов передаются в модуль 302 оценки цвета. Модуль оценки цвета выполнен с возможностью определения цвета фона и текста для каждого фрагмента. На вход данного модуля поступают координаты фрагментов и исходный скриншот. Информация о цвете фона передается в модуль 303 ретуширования, информация о цвете текста передается в модуль 305 создания метафайла. Модуль 304 векторизации выполняет аппроксимацию контуров символов на карте сегментированного текста замкнутой последовательностью отрезков прямых и кривых. На вход данного модуля подается карта из модуля 301 сегментации. Координаты фрагментов, последовательность отрезков прямых и кривых передается в модуль создания метафайла. Модуль 303 ретуширования текста модифицирует исходное растровое изображение скриншота посредством закрашивания области фрагментов с текстом соответствующим цветом фона. На вход данного модуля поступает информация о цвете фона для каждого фрагмента. Модифицированный скриншот передается в модуль 305 создания метафайла, выполненный с возможностью формирования метафайла из следующих записей: модифицированного скриншота, замкнутых последовательностей отрезков прямых и кривых, заполненных соответствующим цветом символа.
Все перечисленные модули системы могут быть реализованы в виде SoC, FPGA или ASIC. Функции модулей понятны из их описания и описания существующих способов. Проиллюстрированы только те признаки, которые упомянуты в описании. Однако следует понимать, что вычислительная система может иметь дополнительные признаки, которые не были проиллюстрированы.
Имеет смысл детально рассмотреть два возможных подхода для обнаружения текста. Первый алгоритм быстрее и предназначен для обнаружения сглаженного текста, который типичен для дисплеев. Второй алгоритм более общий, подходит для обнаружения как сглаженного текста, так и текста без сглаживания.
Первый подход обнаружения текстовых фрагментов включает в себя следующие шаги:
- обнаруживают соседние пиксели с большой производной в горизонтальном направлении;
- объединяют соседние пиксели в фрагменты;
- анализируют гистограммы фрагментов с целью обнаружения сглаженного текста;
- выделяют фрагменты с признаками сглаженного текста.
Фиг.4 иллюстрирует первый подход к обнаружению фрагментов сглаженного текста на скриншоте для последующего анализа. Иллюстрация показывает результат обнаружения горизонтального градиента для одного малого фрагмента 401 скриншота. Вычисленное общее значение горизонтального градиента D i , j Σ
Figure 00000001
403 является конъюнкцией положительного D i , j p o s
Figure 00000002
и отрицательного D i , j n e g
Figure 00000003
градиентов, которые указывают на то, что пиксель ярче/темнее соседних:
D i , j p o s = { 1, I i , j 1 + Δ < I i , j < I i , j + 1 Δ 0, o t h e r w i s e
Figure 00000004
D i , j n e g = { 1, I i , j 1 Δ > I i , j > I i , j + 1 + Δ 0, o t h e r w i s e
Figure 00000005
D i , j Σ = D i , j p o s D i , j n e g
Figure 00000006
Где Ii,j - яркость изображения в точке i, j; Δ - заданный порог.
Результат обнаружения градиента - бинарное изображение 402, ненулевые элементы которого показывают наличие градиента. По причине слабой связности соседних элементов на бинарном изображении выполняется процедура расширения (дилатации) с горизонтальным структурирующим элементом 403. На следующем шаге выделяются отдельные фрагменты 404 по крайним точкам связанных ненулевых пикселей.
Далее анализируется гистограмма каждого выделенного фрагмента с целью обнаружения признаков сглаженного текста и выделения фрагментов, содержащих символы. На Фиг.5 показана иллюстрация анализа гистограммы всех трех компонент цвета (красный, зеленый, синий) цветового пространства RGB для обнаружения признаков сглаженного текста: число ненулевых b+ столбцов гистограммы и нулевых b0. Гистограмма фрагмента 504, содержащего нетекстовые данные, характеризуется полностью непрерывным распределением 501-503 для каждой компоненты цвета. Гистограмма фрагмента 508, содержащего сглаженный текст, состоит всего из нескольких b+ (например, для технологии MS ClearType экспериментальным путем получено b+=7) ненулевых столбцов, которые равномерно распределены между цветом фона и текста (SOS-SOT). В предпочтительном варианте изобретения, если и b0>6, тогда фрагмент классифицируется как текстовый, иначе - как нетекстовый 509.
Второй подход к обнаружению фрагментов с текстом включает следующие шаги:
- разделяют изображения на прямоугольные блоки с перекрытием;
- вычисляют признаки для каждого блока;
- классифицируют каждый блок;
- объединяют соседние блоки в фрагменты текста. В предпочтительном варианте реализации размер блока составляет 7×7 или 9×9 пикселей. Перекрытие блоков может составлять 1, или 2, или 3 пикселя.
Для каждого блока вычисляют следующие признаки:
- число ненулевых столбцов и нулевых столбцов гистограммы раздельно для каждого канала;
- средняя яркость блока: I ¯ i = r = 1 N c = 1 N I i ( r , c ) N 2
Figure 00000007
, где Ii(r, c) - яркость пикселя в ряду r и колонке c, N - число пикселей в блоке;
- средняя разность средней яркости блока средняя разность средних яркостей блоков Ik в 4-связном соседстве с блоком Ii: d I ¯ i = k = 1 4 | I ¯ i I ¯ k | 4
Figure 00000008
;
- среднее значение вертикальных d I y i
Figure 00000009
и горизонтальных d I x i
Figure 00000010
производных по блокам: d x , y I ¯ i = r = 1 N c = ` N 1 d I x i ( r , c ) + r = 1 N 1 c = ` N d I y i ( r , c ) + 2 N ( N 1 )
Figure 00000011
;
- однородность блока: H = i , j N d ( i , j ) 1 + | i j |
Figure 00000012
, где Nd - это нормированная матрица вхождений, d - определяет пространственную связь;
- процент пикселей с градиентом выше порога: P g = ( r , c ) B i { 1 | I i ( r , c ) > T } / N 2
Figure 00000013
, где ∇I i(r, c) вычисляется как квадратный корень из суммы квадратов горизонтальных и вертикальных производных;
- процент изменений яркостей пикселей на изображении I i o
Figure 00000014
, полученном в результате применения операции морфологического открытия к бинарному изображению I i b
Figure 00000015
, полученному бинаризацией с пороговым значением 128: P m = ( r , c ) B i { 1 | I i o ( r , c ) I i b ( r , c ) } / N 2
Figure 00000016
.
Для классификации на два подмножества (текст и рисунок), основанной на перечисленных выше признаках, может быть использован один из следующих способов: бустинг комитета решающих деревьев (Yoav Freund and Robert E.Schapire. 1997. A decision-theoretic generalization of on-line learning and an application to boosting. J. Comput. Syst. Sci. 55, 1 (August 1997), 119-139.), случайный лес решающих деревьев (Leo Breiman. 2001. Random Forests. Mach. Learn. 45, 1 (October 2001), 5-32.), машина опорных векторов (Corinna Cortes and Vladimir Vapnik. 1995. Support-Vector Networks. Mach. Learn. 20, 3 (September 1995), 273-297.), способ К-ближайших соседей (D.Coomans, D.L.Massart, Alternative k-nearest neighbour rules in supervised pattern recognition: Part 1. k-Nearest neighbour classification by using alternative voting rules, Analytica Chimica Acta, Volume 136, 1982, Pages 15-27).
На Фиг.6 показана блок-схема процесса векторизации. После обнаружения фрагментов скриншота, содержащих текст, цветные фрагменты трансформируются в полутоновые изображения 601 и увеличиваются на коэффициент к 602. В предпочтительном варианте реализации заявленного способа применяется билинейная интерполяция, так как исходное разрешение символа на скриншоте мало. Например, при разрешении экрана 1920×1080 пикселей высота строчного символа шрифта Times New Roman 12-го кегля при 100% масштабе составляет 7-8 пикселей. Далее полутоновые фрагменты повышенного разрешения бинаризуются 603. В предпочтительном варианте реализации для определения порога сегментации используется метод Отцу (N.Otsu, "А threshold selection method from grey level histogram", IEEE Transactions on System Man Cybernetics, vol. 9 no. 1, 1979, pp.62-66.). Bсe бинаризованные фрагменты объединяются в соответствии с их координатами на скриншоте для формирования карты сегментированного текста. В предпочтительном варианте реализации использован коэффициент к равный трем.
На шаге 604 отслеживаются внешние и внутренние контура каждого текстового фрагмента для получения траектории контуров данного фрагмента. На данном этапе контур представляет собой замкнутую последовательность точек (вершин), связанных линейными сегментами минимальной длины, равной одному пикселю. Процедура отслеживания идет от начальной вершины вдоль контурной линии по заданному направлению, пока начальная вершина не будет достигнута снова. На следующем шаге 605 уменьшается количество вершин за счет аппроксимации контурной траектории многоугольником. Многоугольник преобразуется в сглаженный контур на шаге 606 за счет аппроксимации замкнутой последовательностью отрезков прямых и кривых. В предпочтительном варианте реализации заявленного способа используются кубические кривые Безье (Piegl, L.Fundamental Developments of Computer Aided Geometric Design. San Diego, CA: Academic Press, 1993). В общем случае, аппроксимация линейными отрезками основана на определении координат концов отрезков. Аппроксимация кривыми отрезками требует определения концов отрезков и соответствующих опорных точек. Например, в соответствии с иллюстрацией на Фиг.7, угол 703 между краями 701-703 и 703-706 полинома может быть аппроксимирован кубической кривой Безье 705, ограниченной точками 702 и 704. Пример аппроксимации символа 707 показан на 708.
Иллюстрация преобразования текста скриншота из исходного растрового вида к векторному показана на Фиг.8 в соответствии с шагами 201, 203 и 204. Фрагмент 801 сглаженного текста увеличивается (802) для улучшения разрешения и преобразовывается в бинарное избражение 803. Результирующий векторизованный фрагмент представлен на 804.
Фиг.9 демонстрирует результат применения заявленного способа. Первый фрагмент 901 соответствует исходному скриншоту. Второй - фрагменту 902 напечатанного скриншота. Третий фрагмент 903 получен печатью скриншота с повышенным с помощью билинейной интерполяции разрешением. И для сравнения четвертым приведен фрагмент 904 напечатанного скриншота после обработки заявленным способом. Текст выглядит более четким и контрастным.
Дальнейшие аспекты изобретения могут быть получены из рассмотрения иллюстраций и описания предпочтительных вариантов реализации. Специалистам ясно, что возможны разные варианты осуществления изобретения, добавления и замены, не выходящие за рамки притязаний и смысла настоящего изобретения, раскрытых в прилагаемой формуле изобретения.
Заявляемый способ и система предназначены для реализации в драйвере принтера или поддерживающего программного обеспечения для черно-белых и цветных принтеров или МФУ. Кроме того способ может быть реализован в виде программного приложения для печати.

Claims (9)

1. Способ преобразования снимка экрана в метафайл, включающий в себя выполнение следующих операций:
- обнаруживают фрагменты сглаженного текста на снимке экрана;
- оценивают цвет фона и цвет символов сглаженного текста на каждом фрагменте на основе определения крайних столбцов гистограммы фрагмента;
- векторизуют контуры символов сглаженного текста;
- модифицируют снимок экрана за счет замещения фрагментов сглаженного текста цветом фона;
- создают метафайл на основе модифицированного снимка экрана и векторизованных контуров, заполненных цветом символов сглаженного текста;
- визуализируют созданный метафайл посредством отображения на дисплее или посредством печати.
2. Способ по п.1, отличающийся тем, что фрагменты сглаженного текста на снимке экрана обнаруживают путем выполнения следующих операций:
- обнаруживают соседние пиксели с высоким значением горизонтального градиента;
- объединяют соседние пиксели во фрагменты;
- анализируют гистограммы фрагментов на предмет обнаружения признаков сглаженного текста;
- выделяют фрагменты с признаками сглаженного текста.
3. Способ по п.2, отличающийся тем, что объединяют соседние пиксели во фрагменты посредством морфологического расширения (дилатации) и определения ограничивающих прямоугольников для каждой связанной группы пикселей.
4. Способ по п.2, отличающийся тем, что в процессе анализа гистограммы фрагментов обнаружение признаков сглаженного текста осуществляют за счет того, что подсчитывают количество изолированных групп с ненулевыми столбцами для каждого цвета и проверяют это количество на превышение заданного порога.
5. Способ по п.1, отличающийся тем, что фрагменты сглаженного текста на снимке экрана обнаруживают путем выполнения следующих операций:
- делят снимок экрана на пересекающиеся прямоугольные блоки;
- вычисляют признаки для каждого блока;
- классифицируют каждый блок как текстовый или нетекстовый;
- объединяют соседние блоки во фрагменты текста.
6. Способ по п.5, отличающийся тем, что для каждого блока вычисляют следующие характерные признаки:
- число ненулевых столбцов b + и нулевых столбцов b 0 раздельно для каждого канала цветового пространства RGB;
- среднюю яркость блока:
Figure 00000017
, где I i (r,c) - яркость пикселя, расположенного в строке r и столбце c, N - количество пикселей в блоке;
- среднюю разность средних яркостей блоков I k в 4-связном соседстве с блоком
Figure 00000018
;
- среднее значение вертикальных
Figure 00000019
и горизонтальных
Figure 00000020
производных по блокам:
Figure 00000021
;
- однородность блока:
Figure 00000022
, где N d - это нормированная матрица вхождений, d - определяет пространственную связь;
- процент пикселей с градиентом выше порога:
Figure 00000023
вычисляется как квадратный корень из суммы квадратов горизонтальных и вертикальных производных;
- процент изменений яркостей пикселей на изображении
Figure 00000024
, полученном в результате применения операции морфологического открытия к бинарному изображению
Figure 00000025
, полученному бинаризацией с пороговым значением 128:
Figure 00000026
.
7. Способ по п.5, отличающийся тем, что классифицируют каждый блок как текстовый или нетекстовый по одному из следующих способов: бустинг комитета решающих деревьев, случайный лес решающих деревьев, машина опорных векторов, способ К-ближайших соседей.
8. Способ по п.1, отличающийся тем, что векторизуют контуры символов сглаженного текста путем выполнения следующих операций:
- преобразуют фрагмент текста в полутоновое изображение;
- повышают разрешение полутонового изображения;
- бинаризуют фрагмент повышенного разрешения;
- отслеживают точки контуров символов в пределах фрагментов для описания траектории контуров;
- сокращают числа вершин контуров;
- аппроксимируют траекторию контуров с сокращенным числом вершин последовательностью отрезков прямых и кривых;
9. Система преобразования снимка экрана в метафайл, включающая в себя:
- модуль сегментации текста, выполненный с возможностью сегментации текста, создания размеченной карты сегментированного текста и определения координат фрагментов, содержащих сглаженный текст; причем на вход модуля поступает исходное растровое изображение снимка экрана, выходы модуля сегментации текста подключены к входам модулей векторизации и ретуширования, куда передается карта, а также к входу модуля оценки цвета, куда передаются координаты фрагментов и исходный снимок экрана;
- модуль оценки цвета, выполненный с возможностью определения цвета фона и текста для каждого фрагмента; на вход модуля поступают с выхода модуля сегментации текста координаты фрагментов и исходный снимок экрана; выходы модуля оценки цвета подключены к входу модуля ретуширования и входу модуля создания метафайла;
- модуль векторизации, выполненный с возможностью аппроксимации контуров символов на карте сегментированного текста замкнутой последовательностью отрезков прямых и кривых; вход модуля подключен к выходу модуля сегментации с возможностью получения карты; выход модуля векторизации подключен к входу модуля создания метафайла;
- модуль ретуширования текста, выполненный с возможностью модификации исходного растрового изображения снимка экрана посредством закрашивания области фрагментов с текстом соответствующим цветом фона; вход модуля подключен к выходу модуля оценки цвета; выход модуля подключен к входу модуля создания метафайла, куда передается модифицированный снимок экрана;
- модуль создания метафайла, выполненный с возможностью формирования метафайла из следующих записей: модифицированного снимка экрана, замкнутых последовательностей отрезков прямых и кривых, заполненных соответствующим цветом символа.
RU2013104245/08A 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл RU2534005C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2013104245/08A RU2534005C2 (ru) 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл
KR1020140003340A KR101887929B1 (ko) 2013-02-01 2014-01-10 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013104245/08A RU2534005C2 (ru) 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл

Publications (2)

Publication Number Publication Date
RU2013104245A RU2013104245A (ru) 2014-08-10
RU2534005C2 true RU2534005C2 (ru) 2014-11-27

Family

ID=51354900

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013104245/08A RU2534005C2 (ru) 2013-02-01 2013-02-01 Способ и система преобразования моментального снимка экрана в метафайл

Country Status (2)

Country Link
KR (1) KR101887929B1 (ru)
RU (1) RU2534005C2 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2669063C2 (ru) * 2015-10-29 2018-10-08 Сяоми Инк. Способ и устройство получения изображений
RU2782162C2 (ru) * 2017-12-11 2022-10-21 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ получения скриншота и связанные с ним изделия

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102053659B1 (ko) * 2017-09-13 2019-12-09 (주)다비오 기계학습과 이미지 프로세싱을 이용한 지도 제작 장치
CN110930302B (zh) * 2018-08-30 2024-03-26 珠海金山办公软件有限公司 一种图片处理方法、装置、电子设备及可读存储介质
CN110727495B (zh) * 2019-10-18 2022-12-23 深圳市比量科技传媒有限公司 一种界面元素的自动分段截图方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6169607B1 (en) * 1996-11-18 2001-01-02 Xerox Corporation Printing black and white reproducible colored test documents
JP2003324604A (ja) * 2002-05-07 2003-11-14 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、プログラム、および記録媒体
US20040145592A1 (en) * 2001-01-09 2004-07-29 Twersky Irving Yitzchak Apparatus and methods for replacing decorative images with text and/or graphical patterns
KR20080095743A (ko) * 2007-04-25 2008-10-29 히타치 오므론 터미널 솔루션즈 가부시키가이샤 화상 처리 프로그램 및 화상 처리 장치
US20090148043A1 (en) * 2007-12-06 2009-06-11 International Business Machines Corporation Method for extracting text from a compound digital image
US20110170801A1 (en) * 2010-01-09 2011-07-14 Microsoft Corporation Resizing of digital images
CN102194114A (zh) * 2011-06-25 2011-09-21 电子科技大学 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
RU2433477C1 (ru) * 2007-07-30 2011-11-10 Долби Лэборетериз Лайсенсинг Корпорейшн Расширение динамического диапазона изображений
RU2469400C1 (ru) * 2011-11-17 2012-12-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ преобразования растрового изображения в метафайл

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3446794B2 (ja) * 1996-08-26 2003-09-16 株式会社日本デジタル研究所 文字認識における多角形近似法および文字認識装置
JP5047051B2 (ja) * 2008-05-02 2012-10-10 キヤノン株式会社 画像処理装置及び画像符号化方法
JP5159588B2 (ja) * 2008-12-05 2013-03-06 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP2012003480A (ja) * 2010-06-16 2012-01-05 Nippon Hoso Kyokai <Nhk> テロップ文字領域検出装置、及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6169607B1 (en) * 1996-11-18 2001-01-02 Xerox Corporation Printing black and white reproducible colored test documents
US20040145592A1 (en) * 2001-01-09 2004-07-29 Twersky Irving Yitzchak Apparatus and methods for replacing decorative images with text and/or graphical patterns
JP2003324604A (ja) * 2002-05-07 2003-11-14 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、プログラム、および記録媒体
KR20080095743A (ko) * 2007-04-25 2008-10-29 히타치 오므론 터미널 솔루션즈 가부시키가이샤 화상 처리 프로그램 및 화상 처리 장치
RU2433477C1 (ru) * 2007-07-30 2011-11-10 Долби Лэборетериз Лайсенсинг Корпорейшн Расширение динамического диапазона изображений
US20090148043A1 (en) * 2007-12-06 2009-06-11 International Business Machines Corporation Method for extracting text from a compound digital image
US20110170801A1 (en) * 2010-01-09 2011-07-14 Microsoft Corporation Resizing of digital images
CN102194114A (zh) * 2011-06-25 2011-09-21 电子科技大学 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
RU2469400C1 (ru) * 2011-11-17 2012-12-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ преобразования растрового изображения в метафайл

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2669063C2 (ru) * 2015-10-29 2018-10-08 Сяоми Инк. Способ и устройство получения изображений
US10530836B2 (en) 2015-10-29 2020-01-07 Xiaomi Inc. Methods and apparatuses for acquiring image
RU2782162C2 (ru) * 2017-12-11 2022-10-21 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ получения скриншота и связанные с ним изделия
RU2782162C9 (ru) * 2017-12-11 2022-12-26 Гуандун Оппо Мобайл Телекоммьюникейшнс Корп., Лтд. Способ получения скриншота и связанные с ним изделия
RU2848148C1 (ru) * 2025-01-31 2025-10-16 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Способ различения изображений, полученных камерой мобильного устройства, и изображений, полученных специальными приложениями для создания скриншотов

Also Published As

Publication number Publication date
KR20140099183A (ko) 2014-08-11
KR101887929B1 (ko) 2018-08-13
RU2013104245A (ru) 2014-08-10

Similar Documents

Publication Publication Date Title
US9042649B2 (en) Color document image segmentation and binarization using automatic inpainting
JP6998198B2 (ja) マルチバイナリゼーション画像処理
US10423827B1 (en) Image text recognition
US12387370B2 (en) Detection and identification of objects in images
US20110075936A1 (en) Methods for image processing
US10509959B2 (en) Method and device for segmenting lines in line chart
US8456711B2 (en) SUSAN-based corner sharpening
CN102722729A (zh) 通过用字符的形状特征来比较字符而检测文档变化的方法
RU2534005C2 (ru) Способ и система преобразования моментального снимка экрана в метафайл
JP2004166007A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
US8259374B2 (en) Image processing apparatus and image forming apparatus
Walha et al. Resolution enhancement of textual images: a survey of single image‐based methods
CA2790210C (en) Resolution adjustment of an image that includes text undergoing an ocr process
US9741142B2 (en) Method and apparatus for enabling text editing in a scanned document while maintaining fidelity of the appearance of the text
US10460219B2 (en) Generating an object map from a plurality of binary images
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9225876B2 (en) Method and apparatus for using an enlargement operation to reduce visually detected defects in an image
Ramadhan et al. Text detection in natural image by connected component labeling
JP3952188B2 (ja) 画像補間装置、画像補間方法および画像補間プログラム
US9648208B2 (en) Method and apparatus and using an enlargement operation to reduce visually detected defects in an image
US20120159292A1 (en) Method of processing an object-based image file with content type dependent image processing algorithms
RU2520407C1 (ru) Способ и система улучшения текста при цифровом копировании печатных документов
Kurilin et al. Generation of PDF with vector symbols from scanned document
JP5718728B2 (ja) 文字の読みやすさ評価方法
Zhao et al. Image Resizing Combining Seam-Carving andInterpolation

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20170921

PD4A Correction of name of patent owner
MM4A The patent is invalid due to non-payment of fees

Effective date: 20200202