Over 10 years we help companies reach their financial and branding goals. Engitech is a values-driven technology agency dedicated.

Gallery

Contacts

411 University St, Seattle, USA

engitech@oceanthemes.net

+1 -800-456-478-23

Business Intelligence

Premiers retours sur la performance de Copilot M365 et les contenus SharePoint

Dans ce billet, je ne parlerai pas de Copilot pour SharePoint, dont la sortie reste annoncée sur les Tenants d’Amérique du Nord pour le premier semestre 2024 avant de déferler sur les autres zones géographiques. Je ne manquerai pas de vous partager mes premières expériences sur ce qu’il permet de réaliser, sujet déjà présenté dans ce précédent billet.

Dans ce billet, il est question de la performance de Copilot M365 concernant les contenus SharePoint et ce concernant, j’ai déjà une idée assez précise sur :

  • La performance actuelle de Copilot Microsoft 365,
  • Les axes d’amélioration qui se présentent..

Ce que l’on constate de la performance actuelle de Copilot M365 sur les contenus SharePoint

Dans la version actuelle que j’utilise sur le Tenant US gracieusement mis à disposition pour les essais des MVP, on constate que, comme sur Bing, il suggère des prompts d’exemples, pour ne pas laisser l’utilisateur dans un possible état de passivité proche de celui de la page blanche.

Une expérience proche de Bing… sans les sources Bing ?!

Ensuite, concernant la présentation des résultats, l’expérience est riche puisque, en plus du texte généré attendu, Copilot M365 fournit, comme sur Bing, les fichiers-références principaux utilisés sous générer le texte ainsi que des suggestions de prompts complémentaires.

En revanche, si le texte généré devait s’appuyer également sur le web (Bing, ce qui ne constitue qu’une option activable ou désactivable depuis le centre d’administration M365), je n’accède pas aux références utilisées. Je trouve cela dommage.

Revenons aux contenus SharePoint et voyons là-aussi une nouvelle piste d’amélioration qui me semble là-aussi évidente, c’est que seuls les contenus des bibliothèques de documents SharePoint sont traités : les fichiers OK, les pages SharePoint OK mais pas d’éléments de liste SharePoint !

Pas de liste SharePoint

Concernant les listes, j’ai trouvé un tuto-vidéo qui permet d’ajouter le contenu d’une liste, par exemple une FAQ, dans le traitement de Copilot M365 en passant par Copilot Studio et Power Automate ; voici le lien direct Copilot Studio : Use Generative Answers on SharePoint List (youtube.com).

Un Copilot M365 davantage fait pour la GED ou pour les pages SharePoint ?

Copilot prend en compte les pages SharePoint mais prend-il de façon complète et entière la dimension GED de SharePoint ? Et bien, continuons à faire le tour de la façon dont Copilot M365 traite actuellement nos fichiers SharePoint pour répondre à cette question.

Lorsque que l’on clique sur la flèche en regard du nom fichier, on accède à des informations complémentaires qui permettent de qualifier la source avec le nom du dernier utilisateur ayant modifié le fichier et la date de cette dernière modification.

  

Et là peut s’ouvrir un champ de questions complémentaires : comment Copilot M365 gère-t-il actuellement la structuration de mes données ? Dans les billets de la série « SharePoint et la GED », j’ai décrit différents niveaux de structuration de l’information, en passant par les colonnes de valeur par défaut sur les dossiers et en allant jusqu’à l’expérience de recherche personnalisée avec des filtres à facette, déclarées dans le schéma de recherche…

Que fait Copilot M365 avec nos métadonnées ?

Ma réponse oscille actuellement pour l’instant entre « rien » et « presque rien ».

En effet, les propriétés connues et exploitées par Copilot sont celles que je vous liste ci-contre.

Mais cela va changer car Microsoft communique sur le concept d’index sémantique Copilot M365.

Il est donc temps de passer aux pistes d’amélioration.

Les axes d’amélioration qui se présentent…

Est-ce si important que cela de prendre en compte le schéma de recherche qui peut contenir des métadonnées SharePoint ou de prendre en compte le magasin de termes, l’emplacement du Master Data Management dans les solutions SharePoint ?

La question peut se poser puisque Copilot M365 est une IA générative de texte, qui permet de capitaliser sur des contenus textuels, tapuscrit ou OCR-isé avec SharePoint Syntex (SharePoint Premium) ou transcrit depuis les réunions Ms Teams. C’est le fameux modèle LLM de ChatGPT qui a ainsi fait l’objet de l’intérêt de Microsoft dans son rapprochement avec OpenAI.

Cependant, avant que le prompt soit traité dans le modèle LLM, le prompt « passe » dans le Microsoft Graph, comme une requête adressée au moteur de recherche : cela permet de s’assurer de ne présenter que des données auxquelles vous avez accès.

Cela signifie aussi qu’une requête de recherche va « passer au travers du schéma de recherche » car, comme vu précédemment dans l’épisode 3 de la série « SharePoint et la GED », les métadonnées SharePoint vont permettre d’augmenter l’expérience utilisateur non seulement en termes de filtres à facette mais également en alimentant l’index de recherche, au-delà du contenu plein-texte indexé par le moteur de recherche. En termes de calcul de pertinence, ces colonnes de métadonnées possèdent même un poids supérieur au contenu plein-texte indexé.

Actuellement, Copilot M365 ignore quant à lui le schéma de recherche et ses colonnes gérées et, par conséquent, le magasin de termes.

Microsoft y travaille : quand Microsoft explique le fonctionnement de Copilot M365, le concept d’index sémantique est mis en avant, pour améliorer la qualité de la proposition formulée par Copilot.

Améliorer la qualité avec l’index sémantique

Ce concept avait été aperçu avec Project Cortex et Viva Topics (billet datant de 2020), que Microsoft a décidé de décommissionner en janvier 2025 au profit de Copilot M365 : le concept d’index sémantique ouvre le champ à la recherche par vectorisation, i.e. un traitement d’enrichissement de l’index de recherche au travers de regroupement logiques. Comme Microsoft l’écrit dans la page de learn.microsoft.com, « Cela signifie qu’au lieu d’utiliser des méthodes traditionnelles pour interroger en fonction de correspondances exactes ou de critères prédéfinis, l’index sémantique peut trouver les données les plus similaires ou pertinentes en fonction de la signification sémantique ou contextuelle.« 

Cela se traduit par le concept plus connu de « recherche floue », qui devrait pouvoir se gérer sur base de règles de type :

  • Référentiel documentaire traditionnel, pour gérer des synonymes et des acronymes dans des thesaurus par Métier, de manière à pouvoir spécifier que 2 choses sont égales, pareilles (exemple : « Delflopion » = « pomme »),
  • Référentiel logique, pour gérer des types de concept, de manière à indiquer le type d’une chose (pomme [enfant] = fruit [parent]),
  • Référentiel relationnel, pour gérer la relation hiérarchique entre 2 choses (pomme < pommier commun ou domestique ou Malus x.domestica < famille Rosaceae <…).

Peut-être que vous avez pensé au magasin de termes en lisant ces dernières lignes ; comme évoqué plus tôt, on peut effectivement imaginer qu’il va être essentiel dans la gestion de l’index sémantique.

Cela améliora la qualité des réponses du moteur de recherche et, par contagion, celle de la pertinence de l’IA générative.

Après la qualité, un second aspect d’amélioration est de jouer sur la quantité. Explications

Améliorer en jouant sur la quantité ?

Que signifie jouer sur la quantité ?

Depuis que j’utilise Copilot M365 et ai réalisé mes premiers Copilots spécialisés via Copilot Studio (épisode 5 de la série « SharePoint et la GED »), je me suis intéressé à la façon dont fonctionne le robot d’indexation de ChatGPT, baptisé « GPTBot », même si c’est désormais l’indexation de SharePoint qui alimente Microsoft Graph :

  • Le robot a été entrainé pour traiter des pages Web, donc des documents « courts » par rapport à des fichiers Office ou PDF qui peuvent compter couramment des centaines de page ;
  • A ma connaissance, tout le contenu est indexé « à plat », sans conserver la structure HTML/XML des informations textuelles.

Sur la base de ces deux constats, dans le but d’optimiser le traitement de LLM, j’ai coutume de privilégier les fichiers courts.

Par exemple, pour mettre en place un Copilot spécialisé sur des problématiques de FAQ Ressources Humaines, je préfère éclater les documents de référence volumineux qui m’ont été transmis pour créer de plus petits documents en me basant par exemple, sur les chapitres principaux (style Titre 1 d’un document Word).

Alors Microsoft a fini par communiquer officiellement que le modèle LLM ChatGPT 4.0 utilisé par Copilot M365 n’est pas (encore) calibré pour les gros documents (https://support.microsoft.com/en-au/topic/keep-it-short-and-sweet-a-guide-on-the-length-of-documents-that-you-provide-to-copilot-66de2ffd-deb2-4f0c-8984-098316104389) : pas plus de 20 pages, pas plus de 15.000 mots… et Microsoft travaille pour relever ces paramètres.

Voici comment je travaille sans pour autant me lancer dans la personnalisation d’un modèle de LLM avec Microsoft Azure AI Studio ou un autre service Microsoft Azure.

Voici comment s’achève ce billet décrivant mes premiers retours sur la performance de Copilot M365 et les contenus SharePoint.

D’autres billets suivront à chacune nouveauté majeure qui se produira sur ce thèmedans le prochain billet.Platform, j’ai publié un livre intitulé « SharePoint et la Power Platform ».

Par Frank Poireau, M365 Adoption Facilitator, MVP

Nous utilisons des cookies pour personnaliser le contenu et les publicités, fournir des fonctionnalités de médias sociaux et analyser notre trafic. Nous partageons également des informations sur votre utilisation de notre site avec nos partenaires de médias sociaux, de publicité et d'analyse.
Cookies settings
Accept
Privacy & Cookie policy
Privacy & Cookies policy
Cookie name Active

Privacy Policy

What information do we collect?

We collect information from you when you register on our site or place an order. When ordering or registering on our site, as appropriate, you may be asked to enter your: name, e-mail address or mailing address.

What do we use your information for?

Any of the information we collect from you may be used in one of the following ways: To personalize your experience (your information helps us to better respond to your individual needs) To improve our website (we continually strive to improve our website offerings based on the information and feedback we receive from you) To improve customer service (your information helps us to more effectively respond to your customer service requests and support needs) To process transactions Your information, whether public or private, will not be sold, exchanged, transferred, or given to any other company for any reason whatsoever, without your consent, other than for the express purpose of delivering the purchased product or service requested. To administer a contest, promotion, survey or other site feature To send periodic emails The email address you provide for order processing, will only be used to send you information and updates pertaining to your order.

How do we protect your information?

We implement a variety of security measures to maintain the safety of your personal information when you place an order or enter, submit, or access your personal information. We offer the use of a secure server. All supplied sensitive/credit information is transmitted via Secure Socket Layer (SSL) technology and then encrypted into our Payment gateway providers database only to be accessible by those authorized with special access rights to such systems, and are required to?keep the information confidential. After a transaction, your private information (credit cards, social security numbers, financials, etc.) will not be kept on file for more than 60 days.

Do we use cookies?

Yes (Cookies are small files that a site or its service provider transfers to your computers hard drive through your Web browser (if you allow) that enables the sites or service providers systems to recognize your browser and capture and remember certain information We use cookies to help us remember and process the items in your shopping cart, understand and save your preferences for future visits, keep track of advertisements and compile aggregate data about site traffic and site interaction so that we can offer better site experiences and tools in the future. We may contract with third-party service providers to assist us in better understanding our site visitors. These service providers are not permitted to use the information collected on our behalf except to help us conduct and improve our business. If you prefer, you can choose to have your computer warn you each time a cookie is being sent, or you can choose to turn off all cookies via your browser settings. Like most websites, if you turn your cookies off, some of our services may not function properly. However, you can still place orders by contacting customer service. Google Analytics We use Google Analytics on our sites for anonymous reporting of site usage and for advertising on the site. If you would like to opt-out of Google Analytics monitoring your behaviour on our sites please use this link (https://tools.google.com/dlpage/gaoptout/)

Do we disclose any information to outside parties?

We do not sell, trade, or otherwise transfer to outside parties your personally identifiable information. This does not include trusted third parties who assist us in operating our website, conducting our business, or servicing you, so long as those parties agree to keep this information confidential. We may also release your information when we believe release is appropriate to comply with the law, enforce our site policies, or protect ours or others rights, property, or safety. However, non-personally identifiable visitor information may be provided to other parties for marketing, advertising, or other uses.

Registration

The minimum information we need to register you is your name, email address and a password. We will ask you more questions for different services, including sales promotions. Unless we say otherwise, you have to answer all the registration questions. We may also ask some other, voluntary questions during registration for certain services (for example, professional networks) so we can gain a clearer understanding of who you are. This also allows us to personalise services for you. To assist us in our marketing, in addition to the data that you provide to us if you register, we may also obtain data from trusted third parties to help us understand what you might be interested in. This ‘profiling’ information is produced from a variety of sources, including publicly available data (such as the electoral roll) or from sources such as surveys and polls where you have given your permission for your data to be shared. You can choose not to have such data shared with the Guardian from these sources by logging into your account and changing the settings in the privacy section. After you have registered, and with your permission, we may send you emails we think may interest you. Newsletters may be personalised based on what you have been reading on theguardian.com. At any time you can decide not to receive these emails and will be able to ‘unsubscribe’. Logging in using social networking credentials If you log-in to our sites using a Facebook log-in, you are granting permission to Facebook to share your user details with us. This will include your name, email address, date of birth and location which will then be used to form a Guardian identity. You can also use your picture from Facebook as part of your profile. This will also allow us and Facebook to share your, networks, user ID and any other information you choose to share according to your Facebook account settings. If you remove the Guardian app from your Facebook settings, we will no longer have access to this information. If you log-in to our sites using a Google log-in, you grant permission to Google to share your user details with us. This will include your name, email address, date of birth, sex and location which we will then use to form a Guardian identity. You may use your picture from Google as part of your profile. This also allows us to share your networks, user ID and any other information you choose to share according to your Google account settings. If you remove the Guardian from your Google settings, we will no longer have access to this information. If you log-in to our sites using a twitter log-in, we receive your avatar (the small picture that appears next to your tweets) and twitter username.

Children’s Online Privacy Protection Act Compliance

We are in compliance with the requirements of COPPA (Childrens Online Privacy Protection Act), we do not collect any information from anyone under 13 years of age. Our website, products and services are all directed to people who are at least 13 years old or older.

Updating your personal information

We offer a ‘My details’ page (also known as Dashboard), where you can update your personal information at any time, and change your marketing preferences. You can get to this page from most pages on the site – simply click on the ‘My details’ link at the top of the screen when you are signed in.

Online Privacy Policy Only

This online privacy policy applies only to information collected through our website and not to information collected offline.

Your Consent

By using our site, you consent to our privacy policy.

Changes to our Privacy Policy

If we decide to change our privacy policy, we will post those changes on this page.
Save settings
Cookies settings