In derzeit laufenden Beförderungsentscheidungen bei der nordrhein-westfälischen Polizei ist weiterhin davon auszugehen, dass diese auf der Grundlage von rechtswidrigen dienstlichen Beurteilungen getroffen werden. Bereits seit 2017 steht das Beurteilungssystem der Polizei auf dem verwaltungsgerichtlichen Prüfstand. Noch im Dezember 2019 bestätigte nun das Oberverwaltungsgericht die in Nordrhein-Westfalen vorherrschende erstinstanzliche Rechtsprechung.

Die Beurteilungsmaßstäbe müssen nach Ansicht des Senats nicht nur in jeder Polizeibehörde einheitlich sein, sondern im gesamten Geltungsbereich der Beurteilungsrichtlinien. Dieser Rechtsprechung folgen aktuell die Verwaltungsgerichte (vgl. Verwaltungsgericht Köln, Beschluss vom 30.01.2020, Az. 19 L 2465/19). Trotzdem verhindert das Land die Rechtskraft der erstinstanzlichen Entscheidungen durch die Beschwerde, denn die Entscheidung des Oberverwaltungsgerichts ist derzeit bei dem Bundesverwaltungsgericht anhängig.

Dort wird es neben der Frage zur Landeseinheitlichkeit der Beurteilungsmaßstäbe insbesondere um die Frage gehen, ob die bewerteten Einzelmerkmale bei der Bildung des Gesamturteils gleich gewichtet werden können. Im direkten Vergleich zweier Konkurrenten kann bei gleichem Gesamturteil gerade die Gewichtung der Einzelmerkmale den Ausschlag für eine Beförderung oder höhere Einsortierung in einer Beförderungsrangliste geben.

Zu wünschen ist ein Ende der Hängepartie hinsichtlich der Beförderungsentscheidungen im gesamten Bereich der nordrhein-westfälischen Polizei. Abzuwarten ist dazu neben der Entscheidung des Bundesverwaltungsgerichts wohl aber auch die Erstellung neuer Beurteilungsrichtlinien.

Die Entscheidung des Oberverwaltungsgerichts lautet auszugsweise:

„Leitsatz
[…]

a) Der Dienstherr muss dafür Sorge tragen, dass innerhalb des Geltungsbereichs einer Beurteilungsrichtlinie oder innerhalb einer Gruppe von Beamten, die im Geltungsbereich derselben Beurteilungsrichtlinie einer bestimmten Laufbahngruppe angehören, die Gewichtung der Bewertungen der Einzelmerkmale bei der Gesamturteilsbildung einheitlich vorgenommen wird.

b) In den BRL Pol fehlt es an Vorgaben für die Gewichtung der Bewertungen der Einzelmerkmale bei der Gesamturteilsbildung in den dienstlichen Beurteilungen der Polizeibeamten der Laufbahngruppen 1, zweites Einstiegsamt, und 2, erstes Einstiegsamt.

3. Unter Geltung der BRL Pol (juris: PolDBeurtRL NW) ist es aus Rechtsgründen nicht zu beanstanden, wenn allen Einzelmerkmalen für die Bildung des Gesamturteils der dienstlichen Beurteilung gleiches Gewicht zugemessen wird.

[…] Entscheidungsgründe […]


VI. Die dienstliche Beurteilung des Klägers ist ferner rechtswidrig, weil sie keine geeignete Grundlage für Auswahlentscheidungen nach Art. 33 Abs. 2 GG darstellt. Es fehlt an den erforderlichen dienstherrn- und laufbahnweit einheitlichen Vorgaben für die Gewichtung der Bewertungen der Einzelmerkmale bei der Gesamturteilsbildung mit der Folge einer uneinheitlichen Gewichtungspraxis (1.). Daher hätte das Gesamturteil der dienstlichen Beurteilung begründet werden müssen (2.).


1. Maßgeblicher Zweck der dienstlichen Beurteilung und insbesondere des Gesamturteils ist es, Grundlage für einen späteren Leistungsvergleich in einem an Art. 33 Abs. 2 GG zu messenden Auswahlverfahren zu sein. Daraus folgt die Notwendigkeit, schon bei der dienstlichen Beurteilung einheitliche Maßstäbe einzuhalten; diese müssen gleich sein und gleich angewendet werden. Dies umfasst es, zu gewährleisten, dass die Gewichtung der Einzelbewertungen für die Gesamturteilsbildung weder mit Bezug auf den konkret durch den Beamten innegehabten Dienstposten noch durch verschiedene Beurteiler unterschiedlich erfolgt. Vielmehr muss der Dienstherr dafür Sorge tragen, dass innerhalb des Geltungsbereichs einer Beurteilungsrichtlinie oder innerhalb einer Gruppe von Beamten, die im Geltungsbereich derselben Beurteilungsrichtlinie einer bestimmten Laufbahngruppe angehören, diese Gewichtung einheitlich vorgenommen wird (im Folgenden auch verkürzt mit „landeseinheitlich“ bezeichnet).


BVerwG, etwa Urteile vom 1. März 2018 – 2 A 10.17 -, a. a. O. Rn. 44 f. und bereits vom 18. Juli 2001 – 2 C 41.00 -, NVwZ-RR 2002, 201 = juris Rn. 14, sowie vom 30. April 1981 – 2 C 26.78ZBR 1982, 174 = juris Rn. 25; Beschluss vom 21. Dezember 2016 – 2 VR 1.16 -, a. a. O. Rn. 25 m. w. N.; auch BVerfG, Nichtannahmebeschluss vom 17. Februar 2017 – 2 BvR 1558/16 -, NVwZ 2017, 1133 = juris Rn. 10 f.


Hiergegen hat das beklagte Land mit dem Schriftsatz vom 18. November 2019 und in der mündlichen Verhandlung, in der es die schriftsätzlich vorgetragene Argumentation bekräftigt hat, vergeblich eingewandt, diese Rechtsprechung verkenne, dass im Bereich des – in den BRL Pol noch so bezeichneten – mittleren und gehobenen Dienstes nach Nr. 9.3 BRL Pol ein behördenspezifisches Beurteilungsverfahren bestehe. Deshalb müssten einheitliche Beurteilungsmaßstäbe nur im Bereich der Behörde, der der zu beurteilende Polizeibeamte angehöre, nicht aber im gesamten Geltungsbereich der BRL Pol (Nr. 2) eingehalten werden. Sofern bei der Gesamturteilsbildung von Behördenleitern unterschiedliche Maßstäbe angelegt würden, führe dies daher nicht zur Rechtswidrigkeit der jeweiligen Beurteilungen. Dieser Umstand erlange erst Bedeutung in Konkurrenzsituationen mit der Konsequenz, dass gegebenenfalls die Vergleichbarmachung der Beurteilungen notwendig werde.

Diese Rechtsauffassung teilt der Senat nicht. Sie würde, wie bereits das Verwaltungsgericht dargetan hat, zu einer den Anspruch der Beamten gemäß Art. 3 Abs. 1 GG verletzenden Ungleichbehandlung bei der Beurteilung dienstlicher Leistungen und in der Folge zu einer mit Art. 33 Abs. 2 GG unverträglichen Wettbewerbsverzerrung führen, für die ein rechtfertigender Grund nicht ersichtlich ist. Dass die Anwendung und Umsetzung einheitlicher Beurteilungsmaßstäbe behördenbezogen erfolgt, ist angesichts der großen Zahl der im Bereich der Polizei beschäftigten Beamten praktischen Bedürfnissen geschuldet. Praktikabilitätsgesichtspunkte, die es rechtfertigen würden, bereits von dem Postulat der Vorgabe gleicher Maßstäbe abzusehen, sind nicht ersichtlich.

Für seine abweichende Auffassung stützt sich das beklagte Land vergeblich auf Nr. 9.3 Satz 1 BRL Pol. Diese Vorschrift bestimmt lediglich, dass die Beurteilung der Beamtinnen und Beamten des mittleren und gehobenen Dienstes (jetzt: Laufbahngruppen 1, zweites Einstiegsamt, und 2, erstes Einstiegsamt, vgl. § 5 Abs. 2 LBG NRW) der Leiterin oder dem Leiter der Behörde obliegt (Endbeurteilung), bei der die Beamtin oder der Beamte beschäftigt ist. Sie findet sich systematisch im Abschnitt 9 „Beurteilungsverfahren“ und steht schon in keinem inneren Zusammenhang zu der maßgeblichen Bestimmung zur Gesamturteilsbildung in Nr. 8.1. BRL Pol. Vielmehr handelt sich um eine reine Zuständigkeitsregelung, die von der Vorgabe und Einhaltung eines landeseinheitlichen Maßstabs nicht entbindet. Letzteres folgt auch nicht aus dem Fehlen einer der Nr. 9.4 Abs. 4 BRL Pol vergleichbaren Regelung für die Beamten des mittleren und gehobenen Dienstes. Nr. 9.4 Abs. 4 BRL Pol bestimmt für Beamte des höheren Dienstes (jetzt Laufbahngruppe 2, zweites Einstiegsamt), dass die zur Endbeurteilung Befugten sich zur Gewährleistung eines landeseinheitlichen Maßstabs kontinuierlich abstimmen. Der Umstand, dass die BRL Pol eine entsprechende Bestimmung für die Beurteilung der Beamten des mittleren und gehobenen Dienstes nicht enthalten, bedeutet nicht, dass von dem aus der Zweckbestimmung dienstlicher Beurteilungen, den Anforderungen des Art. 33 Abs. 2 GG genügende Auswahlentscheidungen auf ihrer Grundlage zu ermöglichen, abgeleiteten Erfordernis landesweit gleicher Beurteilungsmaßstäbe abgesehen werden kann.

Das beklagte Land verweist in diesem Zusammenhang ferner zu Unrecht auf die Pflicht zur Vergleichbarmachung dienstlicher Beurteilungen (oder anderer schriftlicher Leistungseinschätzungen) in Konkurrenzsituationen.


Vgl. etwa OVG NRW, Beschluss vom 31. März 2017 – 6 B 1463/16 -, juris Rn. 13 m. w. N.


Diese Pflicht trifft den Dienstherrn namentlich in Fällen, in denen unter Anwendung der gleichen Beurteilungsrichtlinien erstellte dienstliche Beurteilungen nicht zur Verfügung stehen, und soll dieses Defizit in Konkurrenzlagen ausgleichen. Sie ist demgegenüber ein gegenüber der Vorgabe (und Beachtung) gleicher Maßstäbe weniger wirksames Mittel, das oft genug an praktische Grenzen stößt.


a. An den demnach erforderlichen landesweit einheitlichen Maßstäben für die Bildung des Gesamturteils in den Beurteilungen der Beamten der Laufbahngruppen 1.2 und 2.1 der nordrhein-westfälischen Polizei fehlt es.


aa. Ausdrückliche Vorgaben des Dienstherrn zur Gewichtung der Einzelmerkmale gemäß Nr. 6.1. BRL Pol existieren nicht.

(1) Sie sind insbesondere nicht mit dem Erlass des Ministeriums des Innern des Landes NRW vom 30. August 2018 an das Polizeipräsidium H1. erfolgt. Dieser lag erstens zum Zeitpunkt der Schlusszeichnung der streitgegenständlichen Beurteilung noch gar nicht vor. Abgesehen davon handelt es sich ausdrücklich um einen „Einzelerlass“ (nur) an das Polizeipräsidium H1. „zur Verwendung in den Verwaltungsstreitverfahren 1 K 11812/17 und 1 K 11915/17“, nicht also um eine an alle Polizeibehörden des Landes gerichtete Vorgabe.

(2) Eine ausdrückliche Festlegung, den nach Nr. 6.1 BRL Pol zu bewertenden sieben oder (im Fall von Beamten mit Vorgesetztenfunktion) acht Einzelmerkmalen sei für die Bildung des Gesamturteils jeweils gleiches Gewicht beizumessen, ist auch den BRL Pol nicht zu entnehmen. Nr. 8.1 Satz 1 BRL Pol bestimmt lediglich, dass die Gesamtnote aus der Bewertung der Leistungs- und Befähigungsmerkmale unter Würdigung ihrer Gewichtung und der Gesamtpersönlichkeit der Beamtin oder des Beamten zu bilden ist. Die Vorschrift legt damit fest, dass eine Gewichtung vorzunehmen ist, nicht aber, wie dies zu geschehen hat; sie bestimmt mithin namentlich nicht, dass allen Einzelmerkmalen gleiches Gewicht zukommt.

Ebenso bereits VG Düsseldorf, Beschlüsse vom 9. Juli 2018 – 2 L 1058/18 -, juris Rn. 19, und vom 20. August 2018 – 2 L 1448/18 -, juris Rn. 19; VG Münster, etwa Urteil vom 22. Februar 2019 – 4 K 6785/17 -, n.v.; VG Minden, etwa Urteil vom 6. Mai 2019 – 4 K 882/18 -, n.v.; a. A. VG Köln, Beschluss vom 28. Januar 2019 – 19 L 1860/18 -, juris Rn. 17 f.

Wäre das beabsichtigt gewesen, hätte sich vielmehr eine eindeutige Formulierung wie „Allen Einzelmerkmalen ist für die Bildung des Gesamturteils das gleiche Gewicht zuzumessen“ aufgedrängt.

Näheres zur Gewichtung der Einzelmerkmale ergibt sich auch nicht aus Nr. 8.1 Satz 2 BRL Pol. Danach ist ein Punktwert als arithmetisches Mittel aus den Bewertungen der einzelnen Merkmale nicht zu bilden. Zwar setzte die Bildung des arithmetischen Mittels aus den Einzelbewertungen voraus, dass jenen jeweils gleiches Gewicht zukommt. Mit der Bestimmung wird aber ein solches Vorgehen gerade ausdrücklich ausgeschlossen. Aus welchen Gründen dies der Fall ist, geht aus ihr nicht hervor.

bb. Es besteht ferner keine hinreichende Grundlage für die Annahme einer Regel des Inhalts, dass die Einzelmerkmale gleich zu gewichten sind, solange nichts anderes bestimmt ist, oder dafür, dass der Dienstherr dann eine gleichwertige Behandlung „stillschweigend vorgegeben“ habe.

So aber VG Gelsenkirchen, Urteil vom 10. September 2018 – 1 K 11087/17 -, juris Rn. 51.

Der Rechtsprechung des Bundesverwaltungsgerichts zufolge ist es Zweck des Erfordernisses, das Gesamturteil der dienstlichen Beurteilung zu begründen oder abstrakte Vorgaben für die Gesamturteilsbildung festzulegen, dass die Einhaltung gleicher Maßstäbe gewährleistet und die Gesamturteilsbildung nachvollziehbar und der gerichtlichen Überprüfung zugänglich gemacht wird.

BVerwG, Urteile vom 1. März 2018 – 2 A 10.17 -, a. a. O. Rn. 42, und vom 2. März 2017 – 2 C 51.16 -, IÖD 2017, 170 = juris Rn. 15.

Ausgehend hiervon ist insoweit eine hinreichend deutliche Festlegung zu verlangen, an der es hier fehlt. Angesichts des diesbezüglichen Schweigens des Richtliniengebers kommt vielmehr ebenso in Betracht, dass es dem jeweiligen Anwender überlassen bleiben sollte, die Gewichtung der Einzelmerkmale eigenständig vorzunehmen. So ist die Vorschrift zumindest in einigen Polizeibehörden in der Vergangenheit offenbar auch verstanden und der auf der Grundlage dieses Verständnisses eröffnete Spielraum genutzt worden, indem einzelne Behörden abweichende Gewichtungen der Einzelmerkmale vorgenommen haben. Nach den Ermittlungen des Senats sind zum Regelbeurteilungsstichtag 2014 sowohl das Polizeipräsidium E2. , das eine Faktorisierung sämtlicher Merkmale vorgenommen hat, als auch der Landrat des S. -T1. -Kreises, der dem Merkmal Leistungsgüte hervorgehobene Bedeutung zugemessen hat, von der Praxis der übrigen Behörden abgewichen. Zum Regelbeurteilungsstichtag 2017 war dies noch beim Landrat des S. -T1. -Kreises der Fall. Hinzu treten allerdings mehrere Behörden, die bei der Erstellung einer Beförderungsrangliste (so der Landrat des Kreises F. : Faktorisierung aller Merkmale) bzw. einer Beförderungsrangfolge (Polizeipräsidium P. ) oder -reihenfolge (Polizeipräsidium X3. ) eine unterschiedliche Gewichtung der Einzelmerkmale vorgenommen haben. Das beklagte Land hat in der mündlichen Verhandlung vor dem Senat eingeräumt, in der Vergangenheit zur Sicherstellung landeseinheitlicher Maßstäbe nichts unternommen zu haben; dies sei aufgrund des behördenspezifischen Verfahrens im Bereich der Polizeibeamten der Laufbahngruppen 1.2 und 2.1, das die Einhaltung gleicher Maßstäbe nur behördenweit verlange, auch nicht erforderlich.

Bestätigt wird dieses Verständnis durch das Fehlen einer Regelung zur Entscheidung in sogenannten „Remislagen“, in Situationen also, in denen nicht nur sieben, sondern acht Einzelmerkmale zu bewerten sind und jeweils vier mit dem gleichen höheren und vier mit dem gleichen niedrigeren Punktwert bewertet werden. Geht man davon aus, dass der Richtliniengeber stillschweigend die Gleichgewichtung aller Einzelmerkmale bestimmt hat, so hätte es sich aufgedrängt, ergänzend eine ausdrückliche Regelung für derartige Fälle vorzusehen, denn sie sind ohne eine zusätzliche Vorgabe nicht auflösbar. Eine landeseinheitliche Vorgabe hierzu fehlt aber. Statt dessen hat es der Richtliniengeber (auch) insoweit dem jeweiligen Anwender überlassen, nach welchen Maßgaben die Gesamturteilsbildung erfolgt. Dies hat nach den Feststellungen des Senats zu einer uneinheitlichen und evident gleichheitswidrigen Praxis geführt: Der überwiegende Teil der Polizeibehörden in NRW (26) gibt an, in „Remislagen“ eine „Einzelfallbewertung im Quervergleich unter Würdigung der Persönlichkeit“ vorzunehmen. Acht Behörden vergeben den jeweils niedrigeren Punktwert als Gesamturteil, eine den jeweils höheren. Zwei Behörden lassen das Einzelmerkmal Leistungsgüte den Ausschlag geben, zwei andere das Einzelmerkmal Mitarbeiterführung, das im Gegensatz dazu sechs Behörden für die Gesamturteilsbildung ausblenden. Eine Behörde schließlich stellt auf die Bewertung vier näher bezeichneter Einzelmerkmale ab.

cc. Es kann auf sich beruhen, ob es den Maßgaben des Bundesverwaltungsgerichts zur Sicherstellung der Einheitlichkeit des Beurteilungsmaßstabs genügen würde, wenn im Bereich des Richtliniengebers tatsächlich eine Praxis allgemein bestünde, sämtliche Einzelmerkmale in dienstlichen Beurteilungen gleich zu gewichten. Dem Gebot der Einheitlichkeit des Beurteilungsmaßstabs wäre dabei jedenfalls nur entsprochen, wenn die Gewichtungspraxis landesweit ausnahmslos angewandt würde.

Vgl. BVerwG, Urteil vom 2. März 2000 – 2 C 7.99 -, NVwZ-RR 2000, 621 = juris Rn. 21.

Das ist nach dem oben Ausgeführten nicht der Fall.

Mangels landeseinheitlicher Praxis verweist das beklagte Land auch erfolglos darauf, bei den BRL Pol handele es sich um Verwaltungsvorschriften, bei denen es nicht entscheidend auf ihren Wortlaut ankomme, sondern gegebenenfalls auf eine abweichende tatsächliche Handhabung, wenn sie von dem Richtliniengeber gebilligt oder zumindest geduldet werde.

Vgl. dazu BVerwG, etwa Urteil vom 17. September 2015 – 2 C 27.14 -, a. a. O. Rn. 41; OVG NRW, Beschluss vom 5. Oktober 2010 – 6 A 210/10 -, juris Rn. 17, jeweils m. w. N.

dd. An alldem hält der Senat auch vor dem Hintergrund der Ausführungen im Urteil des Bundesverwaltungsgerichts vom 9. Mai 2019 – 2 C 1.18 – fest. Allerdings hat das Bundesverwaltungsgericht dabei in einem Fall, in dem ebenfalls die BRL Pol anzuwenden waren, entschieden, dass es einer Begründung des Gesamturteils bei einer allein anhand von Zahlen- oder Buchstabenwerten erstellten dienstlichen Beurteilung nicht bedarf, wenn diese eine vergleichsweise geringe Zahl von Einzelmerkmalen (hier: sieben) betrifft, denen der Dienstherr zulässigerweise eine gleich große Bedeutung (dasselbe Gewicht) zumisst.

BVerwG, Urteil vom 9. Mai 2019 – 2 C 1.18 -, IÖD 2019, 230 = juris Rn. 66.

Zur Begründung seiner Auffassung hat sich das Bundesverwaltungsgericht auf den Satz beschränkt, die vorgenommene Gleichgewichtung ergebe sich sowohl aus der zugrunde liegenden Beurteilungsrichtlinie als auch aus dem Vortrag des Vertreters des Beklagten in der Revisionsverhandlung. Dabei wird weder erkennbar, auf welche Norm bzw. welche Normen der BRL Pol sich die Feststellung stützt und aufgrund welcher Zusammenhänge, noch, was der Vertreter des Beklagten in der Revisionsverhandlung vorgetragen hat; der Umstand, dass sich das Bundesverwaltungsgericht auch auf dessen Vorbringen gestützt hat, lässt allerdings auf die Relevanz dieser Gegebenheiten schließen. Auf Nachfrage des Senats hat der Vertreter des Beklagten mitgeteilt, er habe angegeben, in den vom LAFP NRW erstellten Beurteilungen würden die Einzelmerkmale entsprechend der landesweit geltenden Regelungen immer gleich gewichtet. Der Vortrag mag, soweit er die Praxis des LAFP NRW betrifft, richtig gewesen sein; dass er bezogen auf alle Polizeibehörden des Landes zutreffend war, ist nach den Ermittlungen des Senats zur oben dargestellten Beurteilungspraxis zu den Regelbeurteilungsstichtagen 2014 und 2017 allerdings unwahrscheinlich. Wenn zu diesen Zeitpunkten auch nur wenige der Polizeibehörden des Landes die Einzelmerkmale gemäß Nr. 6.1 BRL Pol unterschiedlich gewichtet haben, so ist dies doch vorgekommen, so dass von einer einheitlichen Praxis nicht gesprochen werden kann.

b. Damit erweist sich die dienstliche Beurteilung auch deshalb als rechtswidrig, weil der Kläger nicht in Anwendung eines einheitlich angewandten Beurteilungsstandards beurteilt worden ist. Wie dargelegt, bestand bei den Polizeibehörden im Land Nordrhein-Westfalen im Hinblick auf die Gewichtung der Einzelmerkmale bei der Bildung des Gesamturteils in den dienstlichen Beurteilungen der Beamten der Laufbahngruppen 1.2 und 2.1 in der Vergangenheit und auch noch zum Regelbeurteilungsstichtag 2017 eine uneinheitliche Praxis; dass dies nur in geringem und zuletzt geringstmöglichem Ausmaß der Fall war, ändert an der Uneinheitlichkeit nichts. Dafür, dass der Dienstherr versucht hätte, dem entgegenzuwirken und eine einheitliche Handhabung sicherzustellen, ist nichts ersichtlich. Die noch immer bestehende, in hohem Maß uneinheitliche Verwaltungsübung im Hinblick auf die Bildung des Gesamturteils in sogenannten „Remislagen“ zeigt vielmehr, dass er divergierende Handhabungen hingenommen hat.

2. Vor diesem Hintergrund ist die dienstliche Beurteilung des Klägers ferner deshalb zu beanstanden, weil in ihr das Gesamturteil nicht näher begründet ist. Beurteilungen, die im Ankreuzverfahren oder – wie hier – allein anhand von Zahlen- oder Buchstabenwerten erstellt werden, müssen im Regelfall eine Begründung des Gesamturteils enthalten.

Vgl. BVerwG, Urteile vom 1. März 2018 – 2 A 10.17 -, a. a. O. Rn. 42, vom 2. März 2017 – 2 C 51.16 -, a. a. O. Rn. 11 ff., vom 2. März 2017 – 2 C 21.16 -, a. a. O., Rn. 58 ff., jeweils m. w. N., vom 28. Januar 2016 – 2 A 1.14 -, juris Rn. 30 ff., vom 17. September 2015 – 2 C 27.14 -, a. a. O. Rn. 30 ff., sowie Beschluss vom 21. Dezember 2016 – 2 VR 1.16 -, a. a. O. Rn. 38 ff.; OVG NRW, etwa Beschluss vom 25. Oktober 2018 – 6 B 1101/18 -, juris Rn. 5 m. w. N.

Dieser bedarf es nicht, wenn hinreichend deutliche abstrakt-generelle Vorgaben des Dienstherrn etwa in Beurteilungsrichtlinien zum Gewicht der Einzelbewertungen bzw. zur Herleitung des Gesamturteils aus diesen bestehen.

BVerwG, Urteile vom 1. März 2018 – 2 A 10.17 -, a. a. O. Rn. 45, und vom 2. März 2017 – 2 C 51.16 -, a. a.O. Rn. 15.

Dies ist indessen nach dem oben Ausgeführten hier nicht der Fall. Die Begründung des Gesamturteils war auch nicht deshalb entbehrlich, weil sich im konkreten Fall die vergebene Note vergleichbar einer Ermessensreduzierung auf Null geradezu aufdrängte. Denn angesichts der Bewertung von drei Einzelmerkmalen mit 4 und vier Einzelmerkmalen mit 3 Punkten wäre bei herausgehobener Gewichtung eines oder mehrerer der mit 4 Punkten bewerteten Merkmale auch ein Gesamturteil von 4 Punkten plausiblerweise in Betracht gekommen.

3. Folge dieser Rechtsfehler ist die Rechtswidrigkeit der streitgegenständlichen Beurteilung, die den Kläger in seinen Rechten verletzt. Das Fehlen einheitlicher Maßstäbe für die Bildung des Gesamturteils der dienstlichen Beurteilung und die daraus folgende uneinheitliche Praxis gewinnen entgegen der Auffassung des beklagten Landes nicht erst rechtliche Relevanz in Konkurrenzsituationen.

Vgl. etwa BVerwG, Urteile vom 2. März 2017 – 2 C 51.16 -, a .a. O. Rn. 22, vom 2. März 2000 – 2 C 7.99 -, a. a. O. Rn. 21, und vom 30. April 1981 – 2 C 26.78 -, a. a. O. Rn. 30.

VII. Soweit in der dienstlichen Beurteilung des Klägers sämtliche Einzelmerkmale mit gleichem Gewicht in das Gesamturteil eingeflossen sind, bestehen – wie der Senat bereits im Beschluss vom 5. September 2019 – 6 B 852/19 -, juris Rn. 51 ff., entschieden hat – unter Geltung der BRL Pol aus Rechtsgründen Bedenken gegen eine solche Vorgehensweise nicht. Hier ist vielmehr eine entsprechende wertende Entscheidung aus Rechtsgründen ebenso zulässig wie andere plausible Gewichtungen.

Vgl. auch BVerwG, Urteil vom 9. Mai 2019 – 2 C 1.18 -, a. a. O. Rn. 66.

Hierzu hat der Senat ausgeführt:

a) Im Hinblick auf die in dienstlichen Beurteilungen vorgenommenen Wertungen ist – auch im Urteil des Bundesverwaltungsgerichts –

2 A 10.17 -, a. a. O. Rn. 46 –

ein Beurteilungsspielraum des Dienstherrn anerkannt, der der gerichtlichen Überprüfung nur eingeschränkt zugänglich ist. Hieran hat die in den letzten Jahren festzustellende Tendenz, die Dichte der gerichtlichen Kontrolle bei der Überprüfung der Rechtmäßigkeit dienstlicher Beurteilungen zu erhöhen, im Grundsatz nichts geändert. Zu den weiterhin dem Dienstherrn vorbehaltenen und aus Rechtsgründen nur sehr eingeschränkt determinierten Wertungen gehört die Frage, welche Einzelmerkmale dieser für die Ermittlung des Gesamtergebnisses für besonders bedeutsam hält. Es ist allein Sache des Dienstherrn, bestimmten Merkmalen im Verhältnis zu anderen bei der Beurteilung von Eignung, Befähigung und fachlicher Leistung besonderes Gewicht beizumessen. Erstreckt sich nämlich die dem Dienstherrn eingeräumte Beurteilungsermächtigung u.a. darauf, die zahlreichen Anforderungen festzulegen, denen der Beamte im Rahmen seiner Laufbahn gewachsen sein muss, so gilt dies in gleicher Weise auch für die Bestimmung der spezifischen Anforderungen, die nach seiner Einschätzung für die Erfüllung der mit den Ämtern der Laufbahn verbundenen Aufgaben von besonderer Bedeutung sind.

Vgl. OVG NRW, Beschluss vom 1. März 2011 – 1 A 808/09 -, juris Rn. 26.

Gerichtlicher Überprüfung zugänglich ist insoweit namentlich, ob die vorgenommene Gewichtung die Grenze der Implausibilität überschreitet. Hierzu hat das Bundesverwaltungsgericht ausgeführt, der dem Dienstherrn eröffnete Wertungsspielraum bei der Gewichtung der Einzelmerkmale einer dienstlichen Beurteilung finde dort eine Grenze, wo eine von ihm abstrakt vorgegebene Gewichtung dem Bedeutungsgehalt der Begriffe von „Eignung, Befähigung und fachliche Leistung“ i.S.v. Art. 33 Abs. 2 GG – offensichtlich – nicht mehr gerecht werde. Dies könne etwa dann der Fall sein, wenn der Dienstherr vorgäbe, dass bei einer Vielzahl von zu bewertenden Einzelmerkmalen diesen sämtlich das gleiche Gewicht zukommen solle mit der Folge, dass selbst solche Einzelmerkmale, die für eine Bewertung der Eignung und der fachlichen Leistung eines Beamten regelmäßig im Vordergrund stünden (weil sie den Kern dieser Begriffe ausmachten) wie z.B. „Arbeitsgüte“ und „Arbeitsmenge“ (Qualität und Quantität der Arbeitsergebnisse) – lediglich – mit dem gleichen Gewicht in das Gesamturteil einfließen sollten wie andere, zwar ebenfalls bedeutsame, aber im Vergleich dazu doch nachrangige Einzelmerkmale wie etwa „Fortbildungsbereitschaft“ oder „Offenheit für Innovationsprozesse“.

BVerwG, Urteil vom 1. März 2018 – 2 A 10.17 -, a. a. O. Rn. 46.

Dem folgend hat der Senat es vor einem vergleichbaren Hintergrund als mit Art. 33 Abs. 2 GG unvereinbar angesehen, wenn das Gesamturteil einer dienstlichen Beurteilung – ohne abstrakte Vorgabe zur Wertigkeit der Einzelmerkmale – lediglich als arithmetisches Mittel aus der Bewertung einer Vielzahl von insgesamt 18 Einzelbewertungen gebildet wird.

OVG NRW, Beschluss vom 25. Juli 2019 – 6 B 374/19 -, juris Rn. 23.

Denn in jenem Fall waren die von „Arbeitsleistung“ und „Arbeitsqualität“ bis zu „Einfallsreichtum“ und „Fortbildung“ reichenden Kriterien für die Beurteilung von Eignung, Befähigung und fachlicher Leistung ersichtlich von deutlich unterschiedlicher Bedeutung; außerdem trat die Beurteilung der gezeigten Leistung, die nach den einschlägigen Beurteilungsrichtlinien in nur drei Einzelmerkmalen erfasst wurde, in nicht mehr sachgerechter Weise gegenüber der Befähigungsbeurteilung zurück, für die 15 Einzelmerkmale vorgesehen waren.

Gemessen daran hält es der Rechtskontrolle stand, wenn der Dienstherr die hier vorgesehenen sieben bzw. acht Leistungs- und Befähigungsmerkmale für die Ermittlung des Gesamtergebnisses gleich gewichtet. Die Gegebenheiten des Streitfalls sind mit denjenigen der vorstehend genannten Fallgestaltungen nicht vergleichbar. Nach Nr. 6.1 Satz 1 BRL Pol sind in der dienstlichen Beurteilung die Merkmale Arbeitsorganisation, Arbeitseinsatz, Arbeitsweise, Leistungsgüte, Leistungsumfang, Veränderungskompetenz, soziale Kompetenz und gegebenenfalls Mitarbeiterführung zu bewerten. In die Bewertung der Merkmale sind nach Satz 2 der Vorschrift die nachfolgenden Kriterien einzubeziehen:

1. Arbeitsorganisation: Planung und zielgerichtete Ausrichtung von Arbeitsabläufen, Prioritäten berücksichtigen, Effizienz;
2. Arbeitseinsatz: Initiative und Selbständigkeit, Ausdauer und Belastbarkeit;
3. Arbeitsweise: Analytische Fähigkeit, Gestaltungsspielräume nutzen, Entscheidungsfreude, Urteilsfähigkeit;
4. Leistungsgüte: Schriftlicher und mündlicher Ausdruck, Sorgfalt und Gründlichkeit, Effektivität, Beachten von inhaltlichen, rechtlichen, formalen und zeitlichen Vorgaben;
5. Leistungsumfang: Arbeitsumfang unter Berücksichtigung des jeweiligen Schwierigkeitsgrades und der Verwendbarkeit des Arbeitsergebnisses;
6. Veränderungskompetenz: Bereitschaft, sich neuen Anforderungen zu stellen, Selbstreflexion, Aktive und passive Kritikfähigkeit, Bereitschaft zum lebenslangen Lernen, Bereitschaft, Wissen an andere zu vermitteln;
7. Soziale Kompetenz: Zusammenarbeit mit Kolleginnen und Kollegen, Zusammenarbeit mit Vorgesetzten, Wertschätzung und Teamfähigkeit, Verantwortungsbereitschaft und Zuverlässigkeit, Umgang mit Bürgerinnen und Bürgern;
8. Mitarbeiterführung (nur für Vorgesetzte): Zielentwicklung und -vereinbarung, Leistungsmotivation, Umgang mit Konfliktsituationen, Delegieren und Kontrollieren, Beurteilen und Fördern, Beachten der Ziele der Gesundheitsförderung, Beachten der Ziele der Gleichstellung.

Es ist nicht erkennbar, dass es dem Bedeutungsgehalt der Begriffe von „Eignung, Befähigung und fachliche Leistung“ i.S.v. Art. 33 Abs. 2 GG – zumal offensichtlich – nicht mehr gerecht würde, wenn diesen Merkmalen für die Bildung des Gesamturteils gleiches Gewicht zugemessen wird. Es handelt sich, wie die dazu gegebenen Erläuterungen zeigen, jeweils um verschiedene Submerkmale erfassende Bündelungsmerkmale, deren Zahl deutlich geringer ist als die 18 Einzelmerkmale in dem Sachverhalt, der dem Urteil des Bundesverwaltungsgerichts zugrunde lag. Eine offensichtlich größere Nähe oder aber Distanz eines oder mehrerer dieser sieben bzw. acht Kriterien zu den Begriffen „Eignung, Befähigung und fachliche Leistung“, die es nicht mehr plausibel erscheinen lassen würde, sie mit demselben Gewicht einzustellen wie die anderen, ist nicht auszumachen.

Ebenso VG Gelsenkirchen, Urteil vom 10. September 2018 – 1 K 11087/17 -, a. a. O. Rn. 42; a.A. VG Düsseldorf, etwa Beschlüsse vom 9. Juli 2018 – 2 L 1058/18 -, juris Rn. 12, und vom 20. August 2018 – 2 L 1448/18 -, juris Rn. 12, sowie Urteil vom 12. Dezember 2008 – 2 K 17925/17 -, juris Rn. 33.

Bezeichnenderweise hat auch weder die Vorinstanz noch ein anderes derjenigen Verwaltungsgerichte, die ihre Gleichgewichtung für rechtswidrig erachtet haben, konkret aufgezeigt, in Bezug auf welche Merkmale dies der Fall sein soll, welche Merkmale also aus Rechtsgründen mit welchem (erhöhten) Gewicht in die Gesamturteilsbildung einzustellen sein sollen.

Mit der Gleichgewichtung aller sieben bzw. acht Einzelmerkmale wird auch nicht den Befähigungsmerkmalen gegenüber den Leistungsmerkmalen ein sachlich nicht mehr zu rechtfertigendes Gewicht zugemessen.

Vgl. hierzu (weitgehend) OVG NRW, Urteil vom 17. August 2018 – 1 A 379/17 -, ZBR 2019, 206 = juris Rn. 85.

Die BRL Pol trennen nicht ausdrücklich zwischen Leistungs- und Befähigungsmerkmalen bzw. der entsprechenden Beurteilung. Gleichwohl ist erkennbar, dass eine Beurteilung der Befähigung – also der Fähigkeiten, Kenntnisse, Fertigkeiten und sonstigen Eigenschaften, die für die dienstliche Verwendung wesentlich sind – hier am ehesten mit den Merkmalen zu 6. und zu 7. (Veränderungskompetenz und soziale Kompetenz) erfolgt. Die übrigen fünf bzw. sechs Merkmale erfassen im Wesentlichen Qualität und Quantität der tatsächlich erbrachten Arbeitsergebnisse, das Arbeitsverhalten und bei Beamten, die Vorgesetzte sind, auch das Führungsverhalten und mithin Gesichtspunkte der erbrachten Leistung. Bereits angesichts des erheblichen Überwiegens von fünf oder sechs gegenüber zwei Merkmalen kommt damit der Leistungsbeurteilung insgesamt ein gegenüber der Befähigungsbeurteilung deutlich höheres Gewicht zu, was nicht als unplausibel angesehen werden kann.

Erst recht ist es nicht unzulässig, einzelne Befähigungsmerkmale mit dem gleichen Gewicht einzustellen wie einzelne Leistungsmerkmale.

So aber VG Münster, Urteil vom 19. März 2019 – 4 K 6199/17 -, n.v.

Sofern man – was hier offenbleiben kann – überhaupt ein Überwiegen der Leistungsbeurteilung gegenüber der Befähigungsbeurteilung für erforderlich hält, kommt es für die Frage, wann dieses Erfordernis gewahrt ist, darauf an, im welchem Umfang Leistungsmerkmale einerseits und der Befähigungsbeurteilung zuzurechnende Merkmale andererseits jeweils in der Summe in die Gesamturteilsbildung einfließen.

b) Es überzeugt ferner nicht, wenn das Verwaltungsgericht die Notwendigkeit einer unterschiedlichen Gewichtung der Einzelmerkmale aus dem Wortlaut der Nr. 8.1 BRL Pol ableitet. Nach dieser Bestimmung ist die Gesamtnote aus der Bewertung der Leistungs- und Befähigungsmerkmale unter Würdigung ihrer Gewichtung und der Gesamtpersönlichkeit der Beamtin oder des Beamten zu bilden und in Punkten festzusetzen. Mit der Wendung „unter Würdigung ihrer Gewichtung“ wird vorgegeben, dass eine solche Würdigung zu erfolgen hat; es wird aber gerade nicht festgelegt, wie und mit welchem Ergebnis dies geschehen soll. Auch eine Gleichgewichtung der Einzelmerkmale ist damit nicht ausgeschlossen. Hierzu zwingt auch nicht der Gedanke, dass bei Gleichgewichtung aller Merkmale in Fällen, in denen auch das Merkmal „Mitarbeiterführung“ und damit eine gerade Zahl von Merkmalen zu bewerten ist, ein Patt entstehen kann.

So aber VG Düsseldorf, Beschluss vom 20. August 2018 – 2 L 1448/18 -, a. a. O. Rn. 45.

Das trifft für sich genommen zwar zu, heißt aber nichts weiter, als dass in diesen Fällen eine weitere Vorgabe des Dienstherrn dazu erforderlich ist, woran sich die Entscheidung ausrichten soll. Im Übrigen sind ohne Weiteres Fälle der unterschiedlichen Gewichtung von Einzelmerkmalen denkbar, in denen sich gleichfalls ein solches Patt ergeben kann.

c) Schließlich kann gegen die hier vertretene Auffassung nicht das sogenannte Arithmetisierungsverbot ins Feld geführt werden.

So aber VG Düsseldorf, etwa Urteil vom 12. Dezember 2018 – 2 K 17925/17 -, a. a. O. Rn. 33 ff.; VG Münster, etwa Urteil vom 19. März 2019 – 4 K 6199/17 -, n.v., und Vorinstanz.

Nach der Rechtsprechung des Bundesverwaltungsgerichts darf sich „ohne entsprechende Rechtsgrundlage“ das Gesamturteil in dienstlichen Beurteilungen nicht lediglich aus dem arithmetischen Mittel der Einzelmerkmale ergeben.

Vgl. etwa Urteile vom 2. März 2017 – 2 C 21.16 -, BVerwGE 157, 366 = juris Rn. 63, 71, und vom 17. September 2015 – 2 C 27.14 -, a. a. O. Rn. 33; Beschluss vom 21. März 2012 – 2 B 18.11 -, juris Rn. 7 m. w. N.

Sinn des hier in Nr. 6.1 Satz 2 BRL Pol aufgegriffenen Verbots, bei der Bewertung von Eignung, Befähigung und fachlicher Leistung kein Beurteilungsverfahren einzusetzen, das das Gesamturteil der dienstlichen Beurteilung allein aus dem arithmetischen Mittel gewinnt, ist es zu verhindern, dass die Ermittlung des Gesamturteils auf eine reine Rechenoperation reduziert wird. Der Beurteiler soll bei seiner Aufgabe, aus den einzelnen Beurteilungsgrundlagen ein wertendes Gesamturteil zu bilden, nicht durch mathematische Vorgaben behindert werden oder sich dieser Amtspflicht durch schlichtes „Mathematisieren“ entledigen können. Da es bei der dienstlichen Beurteilung um die Bewertung individueller Leistungen geht, ist vielmehr eine im pflichtgemäßen Ermessen des Dienstherrn stehende wertende Betrachtung unter Würdigung der Gesamtpersönlichkeit des Beamten gefordert.

BVerwG, Urteil vom 2. März 2017 – 2 C 21.16 -, a. a. O. Rn. 71 („Ein reiner Zahlenschematismus ist zu vermeiden“); OVG NRW, Beschluss vom 2. August 2018 – 6 B 864/18 -, a. a. O. Rn. 14; Thür. OVG, Beschluss vom 21. Dezember 2018 – 2 EO 547/17 -, juris Rn. 59; OVG Rheinland-Pfalz, Beschluss vom 14. September 2017 – 2 B 11207/17 -, a. a. O. Rn. 21.

Auch wenn für die Ermittlung des Gesamtergebnisses der dienstlichen Beurteilung normative Gewichtungsvorgaben bestehen, entbinden sie den Beurteiler daher nicht von der Verantwortung, im jeweiligen Beurteilungsfall auf diesem Wege zu einem insgesamt zutreffenden Gesamturteil zu kommen, weshalb ein solches Beurteilungssystem ihm die Möglichkeit belassen muss, im Einzelfall ein vom rechnerischen Ergebnis der – ggfs. gewichteten – Einzelbewertungen abweichendes Gesamturteil zu vergeben (was dann aber wiederum gesondert zu begründen wäre).

VGH Bad.-Württ., Beschluss vom 14. Mai 2019 – 4 S 415/19 -, juris Rn. 6.

Dies zugrunde gelegt steht das Arithmetisierungsverbot einer Gleichgewichtung der Einzelmerkmale nicht entgegen. Dem Gebot, den Vorgang der Gesamturteilsbildung nicht auf eine Rechenoperation zu reduzieren, sondern Raum für eine Gesamtwürdigung zu belassen, kann bei einer gleichen Gewichtung der Einzelmerkmale ebenso Rechnung getragen werden wie bei jeder anderen Gewichtung der Einzelmerkmale, oder anders gewendet: Eine gegen das Arithmetisierungsverbot verstoßende Reduzierung auf eine Rechenoperation könnte selbstverständlich auch dann erfolgen, wenn nicht für alle Einzelmerkmale der gleiche Wert, sondern für einzelne Einzelmerkmale ein höherer Wert in die Rechnung eingestellt wird. Es stellt daher ein Missverständnis dar, das Verbot der arithmetischen Ermittlung des Gesamtergebnisses als Verbot der wertenden Gleichgewichtung bestimmter Merkmale aufzufassen.

OVG Rheinland-Pfalz, Beschluss vom 14. September 2017 – 2 B 11207/17 -, a. a. O. Rn. 22.

Hiervon abzuweichen gibt der Vortrag des Klägers keinen Anlass.

Die Kostenentscheidung folgt aus § 154 Abs. 2 VwGO.
Die Entscheidung über die vorläufige Vollstreckbarkeit beruht auf § 167 VwGO i.V.m. § 708 Nr. 11, 711 ZPO.

Der Senat lässt entsprechend der Anregung des beklagten Landes gemäß § 132 Abs. 2 Nr. 1 VwGO, § 127 BRRG die Revision zu.“